磨削技術
創(chuàng)造AI的原數(shù)據(jù)的安全 |
發(fā)布時間:2023/9/16 |
生成式人工智能的繁榮正在助長一場“數(shù)據(jù)的影子戰(zhàn)爭”。 隨著內容創(chuàng)建者意識到他們的數(shù)據(jù)被用來與他們競爭,強烈的反對正在醞釀之中。 生成式人工智能熱潮始于2022年底ChatGPT的驚人成功?,F(xiàn)在,似乎每家公司都在嘗試使用該技術。 該技術背后的人工智能模型是使用來自數(shù)百萬個不同來源的高質量數(shù)據(jù)集構建的。用行業(yè)術語來說,這些是模型“訓練”的原材料。 Github前首席執(zhí)行官納特·弗里德曼 (Nat Friedman) 在最近接受科技分析師本·湯普森 (Ben Thompson) 采訪時表示:“這是正在發(fā)生的事情表面之下的秘密故事?!?br /> Nvidia GPU是AI模型訓練所需的主要硬件。 “但另一個關鍵輸入是數(shù)據(jù),”弗里德曼說?!耙虼耍壳霸诒砻嬷抡诎l(fā)生一場關于數(shù)據(jù)的影子戰(zhàn)爭,最大的人工智能實驗室正在花費巨額資金來獲取更有價值的代幣,要么花錢請專家生成代幣,要么通過標簽公司工作”。 許多訓練數(shù)據(jù)都是從互聯(lián)網(wǎng)上抓取并未經(jīng)許可使用的。 渴望更多培訓數(shù)據(jù)的科技公司也授予自己新的權限,以使用更多的信息。 從互聯(lián)網(wǎng)上抓取的信息的使用引發(fā)了關于這個新人工智能世界中版權和許可的未來的爭論。 基于免費信息共享的在線社區(qū)也正在被顛覆。當這些數(shù)據(jù)可能會被納入人工智能模型并最終與你競爭時,為什么還要繼續(xù)在線共享呢? 來自熱門編碼問答網(wǎng)站Stack Overflow的數(shù)據(jù)已用于AI模型訓練。最近幾個月,隨著人工智能模型直接提供編碼答案,無需訪問網(wǎng)站并提出問題,流量出現(xiàn)下降。 公司、內容創(chuàng)作者和其他網(wǎng)絡企業(yè)逐漸意識到他們的作品正在被秘密利用來對付他們。 這破壞了網(wǎng)絡的大交易,并引發(fā)了強烈反對。 Salesforce首席執(zhí)行官兼《時代》雜志所有者馬克·貝尼奧夫(Marc Benioff)表示:“媒體公司開始覺醒,意識到他們的很多信息都被盜了——可能你的一些信息也被盜了?!?br /> “作為媒體所有者,這是一個主要問題,因為我確實會去看模特,我會在那里找到《時代》雜志的材料,然后說,‘等一下,那是我的內容,’”他補充道。 越來越多的網(wǎng)站正在屏蔽網(wǎng)絡爬蟲,這些爬蟲是用于在網(wǎng)絡上搜尋數(shù)據(jù)以進行人工智能模型訓練的技術工具。據(jù)Insider8月份報道,來自ChatGPT創(chuàng)建者OpenAI的GPTbot在短短兩周內就被100個最受歡迎網(wǎng)站中超過15% 的網(wǎng)站屏蔽,其中包括亞馬遜和Quora。 Reddit要求為其數(shù)據(jù)付費,這些數(shù)據(jù)是人工智能模型訓練的常見來源。 領先的法律信息提供商LexisNexis不得不警告客戶不要上傳或與人工智能模型和相關機器人共享其數(shù)據(jù)。 Sarah Silverman 起訴OpenAI和Meta,聲稱他們在沒有補償或未經(jīng)許可的情況下使用她的書來訓練他們的人工智能模型。 包括瑪格麗特·阿特伍德(Margaret Atwood)和詹姆斯·帕特森(James Patterson)在內的8000多名作者簽署了一封公開信,要求人工智能公司賠償,因為他們未經(jīng)許可使用他們的作品來訓練人工智能。 人工智能公司正在做出回應,主要是試圖降低法律風險。 Meta 和其他科技公司已停止披露他們用于訓練人工智能模型的訓練數(shù)據(jù)。這部分是出于競爭原因,但觀察人士表示,這也是為了避免法律風險。 根據(jù)8月份發(fā)布的研究顯示,OpenAI 的ChatGPT試圖隱瞞自己接受過受版權保護的材料(例如 JK 羅琳的哈利波特系列叢書)的訓練。 其他研究人員開發(fā)了一種人工智能模型,可以刪除數(shù)據(jù)以降低法律風險。在此過程中,他們還創(chuàng)建了一種方法來衡量特定數(shù)據(jù)對人工智能模型輸出的貢獻。 |
產(chǎn)品展示
聯(lián)系我們
公司地址:南通市通州區(qū)通揚南路588號
聯(lián)系電話:0513-87119922
聯(lián)系人:李先生
手機:15606292777
郵箱:sales@nt2mt.com
網(wǎng)址:http://www.ykhangfeng.com
聯(lián)系電話:0513-87119922
聯(lián)系人:李先生
手機:15606292777
郵箱:sales@nt2mt.com
網(wǎng)址:http://www.ykhangfeng.com