美AI巨頭被控秘密“侵吞”數(shù)據(jù)

7個(gè)月前來源：科技日?qǐng)?bào) 觀看：57

人工智能（AI）迅速發(fā)展離不開對(duì)模型的訓(xùn)練。然而，高質(zhì)量數(shù)據(jù)短缺以及部分領(lǐng)域封閉式的數(shù)據(jù)生態(tài)似乎成為AI發(fā)展的掣肘。

據(jù)多家外媒報(bào)道，OpenAI、谷歌和Meta等公司正尋求在線信息來訓(xùn)練最新的AI系統(tǒng)。但他們無視既定政策，蓄意改變規(guī)則，并試圖規(guī)避版權(quán)法。

收集數(shù)據(jù)“走捷徑”

英國《泰晤士報(bào)》近日刊文指出，科技巨頭一直在“走捷徑”為其AI系統(tǒng)收集訓(xùn)練數(shù)據(jù)。OpenAI開發(fā)了一款名為Whisper的語音識(shí)別工具，可將YouTube視頻中的音頻文件轉(zhuǎn)錄為純文本文檔，從而創(chuàng)建一個(gè)口語對(duì)話數(shù)據(jù)源，幫助訓(xùn)練其下一代基于文本的GPT-4算法。

美國《商業(yè)內(nèi)幕》網(wǎng)報(bào)道稱，YouTube在其官網(wǎng)明令禁止“獨(dú)立”于其之外的應(yīng)用程序使用其視頻內(nèi)容。而OpenAI的數(shù)據(jù)并非意外收集的。

實(shí)際上，OpenAI員工知道這樣做會(huì)涉足法律灰色地帶。OpenAI總裁格雷格·布羅克曼甚至親自參與了所使用視頻的收集。但OpenAI依然認(rèn)為這是合理的，最終獲得了超過100萬小時(shí)的轉(zhuǎn)錄視頻。

最大的謎團(tuán)在于，OpenAI如何訪問足夠多的YouTube視頻來完成這項(xiàng)工作。

當(dāng)OpenAI首席技術(shù)官米拉·穆拉蒂被問及該公司是否使用YouTube視頻來訓(xùn)練Sora時(shí)，她表示并不確定。當(dāng)再次被問及訓(xùn)練數(shù)據(jù)的來源時(shí)，她表示不會(huì)透露細(xì)節(jié)。

《紐約時(shí)報(bào)》稱，與OpenAI一樣，谷歌也轉(zhuǎn)錄了YouTube視頻，為其AI模型收集文本，這可能侵犯了視頻創(chuàng)作者的版權(quán)。去年，谷歌還更改了其服務(wù)條款。此番動(dòng)機(jī)意圖明顯，即允許AI對(duì)來自谷歌文檔中公開可用文檔的數(shù)據(jù)以及上傳到谷歌地圖的餐館評(píng)論等其他材料進(jìn)行訓(xùn)練。

面臨“數(shù)據(jù)瓶頸”

對(duì)于科技公司來說，龐大的數(shù)據(jù)“肥料”是生成式AI的核心養(yǎng)分，也是大模型發(fā)展的必爭之地。唯有足夠的數(shù)據(jù)才能指導(dǎo)技術(shù)即時(shí)生成與人類創(chuàng)作相似的文本、圖像、聲音和視頻，實(shí)現(xiàn)系統(tǒng)創(chuàng)新。

但隨著AI發(fā)展，現(xiàn)有互聯(lián)網(wǎng)信息量的不足、高質(zhì)量文本數(shù)據(jù)的匱乏以及科技巨頭優(yōu)質(zhì)數(shù)據(jù)的壟斷，都可能導(dǎo)致AI“養(yǎng)分不足”。即便谷歌和Meta擁有數(shù)十億用戶，每天都會(huì)產(chǎn)生搜索查詢和社交媒體帖子，但這些數(shù)據(jù)在很大程度上受到隱私法和自身政策的限制，無法讓AI利用這些內(nèi)容。

這些科技公司的處境似乎十分窘迫。據(jù)人工智能研究機(jī)構(gòu)Epoch稱，科技公司最快將于2026年耗盡互聯(lián)網(wǎng)上的高質(zhì)量數(shù)據(jù)。這些公司使用數(shù)據(jù)的速度超過了產(chǎn)生數(shù)據(jù)的速度。

Meta同樣也遇到了訓(xùn)練數(shù)據(jù)可用性限制。該公司打算采取一些措施，例如支付圖書許可費(fèi)用，甚至直接收購一家大型出版商。Meta也曾作出以隱私為中心的變革，因此它使用消費(fèi)者數(shù)據(jù)的方式顯然也受到了限制。

在人類數(shù)據(jù)告急的情況下，不少公司甚至試圖用AI“喂”AI。包括微軟、OpenAI在內(nèi)的公司正在把大模型生成的結(jié)果，也就是所謂的“合成數(shù)據(jù)”，“喂”給參數(shù)更小的模型。但有研究認(rèn)為，合成數(shù)據(jù)最終將讓AI“自食其果”。

因版權(quán)被多方狀告

《紐約時(shí)報(bào)》去年起訴OpenAI和微軟，稱其在未經(jīng)許可的情況下使用受版權(quán)保護(hù)的新聞文章來訓(xùn)練AI聊天機(jī)器人。OpenAI和微軟回應(yīng)稱，這屬于“合理使用”，或者說是版權(quán)法允許的，因?yàn)樗麄優(yōu)榱瞬煌哪康亩脑炝诉@些作品。

去年，超過1萬個(gè)貿(mào)易團(tuán)體、作者、公司和其他人士向美國版權(quán)局提交了有關(guān)AI模型使用創(chuàng)意作品的意見。

生成式AI的迅速興起引發(fā)了一場全球性的高質(zhì)量數(shù)據(jù)競賽。然而，在這個(gè)新領(lǐng)域中，關(guān)于什么是合法的、道德的，沒有明確規(guī)定。

《商業(yè)內(nèi)幕》網(wǎng)稱，目前，谷歌、OpenAI和其他科技公司正在辯解，認(rèn)為將受版權(quán)保護(hù)的內(nèi)容用于AI模型訓(xùn)練是合法的，但監(jiān)管機(jī)構(gòu)及法院尚未對(duì)此作出裁決。

美國電影制作人、前演員及作家賈斯汀·貝特曼告訴版權(quán)局，AI模型在未經(jīng)許可或付費(fèi)的情況下獲取了其作品內(nèi)容。她稱，“這是美國最大的盜竊案”。

收集數(shù)據(jù)“走捷徑”

最大的謎團(tuán)在于，OpenAI如何訪問足夠多的YouTube視頻來完成這項(xiàng)工作。

面臨“數(shù)據(jù)瓶頸”

因版權(quán)被多方狀告

去年，超過1萬個(gè)貿(mào)易團(tuán)體、作者、公司和其他人士向美國版權(quán)局提交了有關(guān)AI模型使用創(chuàng)意作品的意見。

點(diǎn)擊展開全文

本文鏈接：http://www.3ypm.com.cn/news-2-4382-0.html美AI巨頭被控秘密“侵吞”數(shù)據(jù)

聲明：本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn)，不代表本站觀點(diǎn)，本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅，請(qǐng)大家謹(jǐn)防詐騙！若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。

上一篇：單克隆抗體能減緩快速發(fā)展型帕金森病

下一篇：微型植入式腦刺激器僅豌豆大小

為你推薦

確鑿!寧波江北區(qū)套信用卡分付當(dāng)面秒線下當(dāng)面這6個(gè)方法值得收藏

寧波江北區(qū)當(dāng)面套花唄京東白條抖音月付分期樂VISA信用卡分付微電：150 0062 3958 全天當(dāng)面接單在線歡迎來電，還有分付，分期樂，蘋果專享額度都可以辦理！白條怎么套出來，大家在急用錢...

08-06

必看：亞博怎么取不了款追回

必看：亞博怎么取不了款追回【微信chuhei816】被黑不給取款怎么辦，小編來告訴你在互聯(lián)網(wǎng)日益發(fā)展的今天，網(wǎng)上金融活動(dòng)已經(jīng)滲透到我們生活的方方面面。然而，隨之而來的風(fēng)險(xiǎn)也不容...

08-04

驚異!蘭州哪里有套VISA卡信用卡店鋪小白必學(xué)！

蘭州套VISA信用卡分付白條花唄微電：166 2467-0662 全天在線歡迎來電，還有分付，分期樂，蘋果專享額度都可以辦理！談起京東白條怎么刷出來。大家最感興趣的，恐怕是京東白條的額度提取...

08-06

當(dāng)面！泉州套VSIA信用卡支持線下當(dāng)面秒(一手商家無中間商賺差價(jià))（沒有中間商賺差價(jià)不花冤枉錢）

泉州風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】萬事達(dá) 、境外卡、微信分付、抖音月付、支付寶信用購取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒有中間商賺差價(jià)，所有信息已...

08-06

今日必看：抖音分付額度如何提現(xiàn)出來

現(xiàn)在網(wǎng)絡(luò)魚龍混雜，請(qǐng)認(rèn)準(zhǔn)靠譜八年商家，金牌小幫手——小創(chuàng)(137-1300-8979可v可來電)(全年365天不掉線) 【抖音月付分付要怎樣提現(xiàn)】【抖音Dou分期怎么刷出來】【抖...

08-19

新手必讀：得物分期購哪里變現(xiàn)出來靠譜商家教會(huì)你：

現(xiàn)在網(wǎng)絡(luò)魚龍混雜，請(qǐng)認(rèn)準(zhǔn)靠譜八年商家，金牌小幫手——小創(chuàng)(137-1300-6106可v可來電)(全年365天不掉線) 【得物佳物分期購可以提現(xiàn)嗎】【得物的分期購額度怎么套出來...

08-17

《大叔廚房》第1集劇情解析

《大叔廚房》這部電視劇以一家小巧溫馨的餐館為背景，緩緩拉開了故事的序幕。在首集中，焦點(diǎn)聚集于一位48歲中年男性經(jīng)營的小餐館里，這里沒有繁復(fù)的菜單，僅以“隨...

09-10

當(dāng)面！哈爾濱套花唄信用購支持線下秒到賬線下當(dāng)面這9個(gè)方法值得收藏(掌握這2種方法100%取現(xiàn)成功)

哈爾濱風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】微信分付、抖音月付、支付寶信用購取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒有中間商賺差價(jià)，所有信息已實(shí)名安全的很。...

09-01

防暑降溫飲食選擇高溫夏季吃這些

在炎熱的夏季，我們大家需要去注意的地方是比較多的了，尤其我們需要去注意的就是飲食，在這時(shí)候大家是非常容易出現(xiàn)中暑發(fā)熱情況的，這是非常不利于我們身體健康的，極大的威脅我們身...

04-02

小暑的時(shí)候預(yù)防哪些皮膚病呢

不知不覺就是已經(jīng)到了小暑節(jié)氣，在不同的節(jié)氣我們都是需要很好的注意一些養(yǎng)生的方法，在小暑的時(shí)候也是要很好的注意預(yù)防皮膚病，下面就是來看看在小暑的時(shí)候預(yù)防哪些皮膚病吧。一...

04-02

山東交通職業(yè)學(xué)院教師石進(jìn)水榮獲省五一勞動(dòng)獎(jiǎng)?wù)?/a>

　　大眾網(wǎng)記者楊濤報(bào)道　　近日，山東省慶?！拔逡弧眹H勞動(dòng)節(jié)暨省五一勞動(dòng)獎(jiǎng)獲得者表彰大會(huì)在濟(jì)南舉行。省委書記林武出席會(huì)議，省委副書記、省長周乃翔作了講話。會(huì)上...

05-06

清華大學(xué)召開專題座談會(huì)紀(jì)念習(xí)近平總書記3·18重要講話發(fā)表五周年

中國教育報(bào)訊（記者董魯皖龍）近日，清華大學(xué)黨委書記邱勇再次主持召開清華大學(xué)思想政治理論課建設(shè)座談會(huì)，對(duì)習(xí)近平總書記3·18重要講話精神進(jìn)行再學(xué)習(xí)、再認(rèn)...

04-01

頭條！金華京東白條加油包額度提現(xiàn)小白必學(xué)9個(gè)方法極少數(shù)人知道(流程只需兩分鐘快的很)

金華風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】微信分付、抖音月付、支付寶信用購取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒有中間商賺差價(jià)，所有信息已實(shí)名安全的很。十...

08-26

當(dāng)面！紹興線下刷京東白條面對(duì)面突破一切限制眼見為實(shí)強(qiáng)烈推薦！(本地一手商家當(dāng)面秒刷)

紹興風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】微信分付、抖音月付、支付寶信用購取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒有中間商賺差價(jià)，所有信息已實(shí)名安全的很。十...

08-23

從校服到禮服！最純情的星座TOP3...只想談?dòng)啦环质值膽賽?/a>

　　有一種令人稱羨不已的愛情叫做從校服走到禮服，在學(xué)生時(shí)期遇見的另一半，只想跟你談一...

07-03

實(shí)體！佛山套京東白條商家提現(xiàn)秒到賬(2024最佳方法)(流程只需兩分鐘快的很)

佛山風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】微信分付、抖音月付、支付寶信用購取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒有中間商賺差價(jià)，所有信息已實(shí)名安全的很。十...

08-05

頭條！東莞套花唄信用購具體步驟本地商戶支持線下當(dāng)面秒(流程只需兩分鐘快的很)

東莞風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】微信分付、抖音月付、支付寶信用購取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒有中間商賺差價(jià)，所有信息已實(shí)名安全的很。十...

08-05

抖音月付的錢怎么套出來現(xiàn)金（教你一個(gè)方法取現(xiàn)秒到）2024

抖音月付是屬于抖音錢包針對(duì)優(yōu)質(zhì)受邀用戶群體開放使用的一款個(gè)人消費(fèi)分期產(chǎn)品。抖音推出首個(gè)信用消費(fèi)產(chǎn)品“月付”,抖音依托于對(duì)零售產(chǎn)業(yè)數(shù)字化的理解,在業(yè)內(nèi)率先將AI等前沿...

08-21

才明白館陶京東白條加油包變現(xiàn)新手必讀教程(推薦九個(gè)操作步驟套出來)

當(dāng)今社會(huì)非常流行的一個(gè)消費(fèi)額度不知道大家是否了解，京東金融的京東白條，大家可能比較了解京東商城，對(duì)于京東白條可能欠缺一些認(rèn)識(shí)，本文給大家普及一下以及告訴大家京東白條加油...

07-26