用AI生成數(shù)據(jù)訓(xùn)練AI或?qū)е履Ｐ捅罎?，原始?nèi)容9次迭代后成了“胡言亂語”

4個(gè)月前來源：中國科技網(wǎng) 觀看：20

《自然》24日正式發(fā)表的一篇研究論文指出了一個(gè)人工智能（AI）嚴(yán)重問題：用AI生成的數(shù)據(jù)集訓(xùn)練未來幾代機(jī)器學(xué)習(xí)模型，可能會(huì)嚴(yán)重“污染”它們的輸出，這被稱為“模型崩潰”。研究顯示，原始內(nèi)容會(huì)在9次迭代以后，變成不相關(guān)的“胡言亂語”（演示中一個(gè)建筑文本最終變成了野兔的名字），這凸顯出使用可靠數(shù)據(jù)訓(xùn)練AI模型的重要性。

生成式AI工具越來越受歡迎，如大語言模型等，這類工具主要用人類生成的輸入進(jìn)行訓(xùn)練。不過，隨著這些AI模型在互聯(lián)網(wǎng)不斷壯大，計(jì)算機(jī)生成內(nèi)容可能會(huì)以遞歸循環(huán)的形式被用于訓(xùn)練其他AI模型或其自身。

包括英國牛津大學(xué)在內(nèi)的聯(lián)合團(tuán)隊(duì)一直在進(jìn)行相關(guān)研究，并在去年論文預(yù)印本中提出這一概念。在正式發(fā)表的論文中，他們用數(shù)學(xué)模型演示了AI可能會(huì)出現(xiàn)的“模型崩潰”。他們證明了一個(gè)AI會(huì)忽略訓(xùn)練數(shù)據(jù)中的某些輸出（如不太常見的文本），導(dǎo)致其只用一部分?jǐn)?shù)據(jù)集來自我訓(xùn)練。

團(tuán)隊(duì)分析了AI模型會(huì)如何處理主要由AI生成的數(shù)據(jù)集。他們發(fā)現(xiàn)，給模型輸入AI生成的數(shù)據(jù)，會(huì)減弱今后幾代模型的學(xué)習(xí)能力，最終導(dǎo)致了“模型崩潰”。他們測(cè)試的幾乎所有遞歸訓(xùn)練語言模型，都容易出現(xiàn)問題。比如，一個(gè)用中世紀(jì)建筑文本作為原始輸入的測(cè)試，到第9代的輸出已經(jīng)是一串野兔的名字。

團(tuán)隊(duì)指出，用前幾代生成的數(shù)據(jù)集去訓(xùn)練AI，崩潰是一個(gè)不可避免的結(jié)局。他們認(rèn)為，必須對(duì)數(shù)據(jù)進(jìn)行嚴(yán)格過濾。與此同時(shí)，這也意味著依賴人類生成內(nèi)容的AI模型，或許能訓(xùn)練出更高效的AI模型。

總編輯圈點(diǎn)：

對(duì)AI來說，“模型崩潰”就像癌癥一樣，甚至分早期與晚期。在早期時(shí)，被“喂”了生成數(shù)據(jù)的AI會(huì)開始失去一些原始正確數(shù)據(jù)；但在晚期，被“喂”了生成數(shù)據(jù)的AI會(huì)“口吐狂言”——給出完全不符合現(xiàn)實(shí)，也和底層數(shù)據(jù)一點(diǎn)不相關(guān)的結(jié)果，就像本文中的例子一樣。更可怕的是，“模型崩潰”的AI極其固執(zhí)，錯(cuò)誤幾乎難以矯正。它會(huì)持續(xù)強(qiáng)化，最終把錯(cuò)誤結(jié)果認(rèn)為是正確的。這一問題值得所有關(guān)注生成式AI的人們警惕，因?yàn)樗扔谑窃?ldquo;毒化”AI對(duì)真實(shí)世界的認(rèn)知。

總編輯圈點(diǎn)：

點(diǎn)擊展開全文

本文鏈接：http://www.3ypm.com.cn/news-2-10433-0.html用AI生成數(shù)據(jù)訓(xùn)練AI或?qū)е履Ｐ捅罎?，原始?nèi)容9次迭代后成了“胡言亂語”

聲明：本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn)，不代表本站觀點(diǎn)，本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅，請(qǐng)大家謹(jǐn)防詐騙！若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。

下一篇：國家地震預(yù)警工程竣工總體功能與性能達(dá)到世界先進(jìn)水平

為你推薦

確鑿!成都青白江區(qū)京東白條加油額度秒到賬(新手必須知道的方法)

成都青白江區(qū)當(dāng)面套花唄京東白條抖音月付分期樂VISA信用卡分付微電：150 0062 3958 全天當(dāng)面接單在線歡迎來電，還有分付，分期樂，蘋果專享額度都可以辦理！白條怎么套出來，大家在急用...

08-05

名不虛傳!沈陽于洪區(qū)套京東白條當(dāng)面換現(xiàn)金完整流程（3秒拿錢堪稱業(yè)界標(biāo)桿）

一手花唄白條商家微電：150 0062 3958全天在線歡迎來電，還有分付，分期樂，蘋果專享額度都可以辦理！迫于經(jīng)濟(jì)壓力，一些年輕人已經(jīng)在想辦法把白條套線出來。京東白條是京東金融旗下的...

08-04

干貨分享:白條里的錢怎么套出來,終于明白操作流程(2白條里的錢怎么套出來023最新)

干貨分享:白條里的錢怎么套出來,終于明白操作流程(2白條里的錢怎么套出來023最新)。如今許多網(wǎng)民都喜愛了京東商城白條交易套出來這類方法，由于在有京東商城白條信用額度下，在...

08-07

重慶京東白條C店怎么找（最新的白條提取流程）

不過，用戶仍然需要注意合理使用京東白條，按時(shí)還款，避免逾期，以免影響到自己在京東平臺(tái)的信用評(píng)級(jí)。希望本文能夠解答你關(guān)于京東白條的疑問，讓你更加放心地使用這一便捷的消費(fèi)信貸...

08-07

商務(wù)部消費(fèi)促進(jìn)司負(fù)責(zé)人談2024年8月我國消費(fèi)市場(chǎng)情況

8月份，各級(jí)商務(wù)主管部門認(rèn)真貫徹落實(shí)黨中央、國務(wù)院決策部署，創(chuàng)新開展“消費(fèi)促進(jìn)年”系列活動(dòng)，加快推進(jìn)消費(fèi)品以舊換新，推動(dòng)消費(fèi)平穩(wěn)增長。據(jù)國家統(tǒng)計(jì)局?jǐn)?shù)據(jù)，當(dāng)月社會(huì)消費(fèi)品零售...

09-20

三大攻略: 拼多多先用后付不懂如何提出來的我這里可以解決現(xiàn)秒到的三種方法，最靠譜最快方法

現(xiàn)在網(wǎng)絡(luò)魚龍混雜，請(qǐng)認(rèn)準(zhǔn)靠譜八年商家，金牌小幫手——易付( aux678678 可v可來電)(全年365天不掉線) 問今是何世，乃不知有漢，無論魏晉?！　∽g：?jiǎn)柆F(xiàn)在是什么朝...

08-24

華為乾崑智駕 HUAWEI ADS 高階功能包訂閱（包月）迎限時(shí)優(yōu)惠：720 → 199 元月

11 月 12 日消息，“華為智能汽車解決方案”官方微博今日發(fā)布公告，稱隨著 HUAWEI ADS (乾崑智駕) 3.0 版本全面推出，現(xiàn)正對(duì)ADS高階功能包訂閱（包月）推出限時(shí)優(yōu)惠，相關(guān)活動(dòng)...

11-16

橫評(píng):分付要掃哪種二維碼才能消費(fèi)(必須知道的三個(gè)步驟五種小技巧)

橫評(píng):分付要掃哪種二維碼才能消費(fèi)(必須知道的三個(gè)步驟五種小技巧)一種是商家收款碼，其中商家收款碼提交申請(qǐng)后需要通過審核才可以獲得，而個(gè)人收款碼是不需要審核的。分付必須...

09-05

攤上：花唄怎么套出來還款（商家秒到的幾種方法）

攤上：花唄怎么套出來還款（商家秒到的幾種方法）但由于消費(fèi)場(chǎng)景的限制，不少人就在想怎么把花唄的錢弄出來用在其他地方，特別是在2020年以來由于疫情原因讓很多人都陷入財(cái)務(wù)困難的境...

09-03

藥明康德第三季度收入重回百億元規(guī)模；安斯泰來撤回向歐洲藥品管理局遞交的ACP

這里是《21健訊Daily》，歡迎與21世紀(jì)經(jīng)濟(jì)報(bào)道新健康團(tuán)隊(duì)共同關(guān)注醫(yī)藥健康行業(yè)最新事件！政策動(dòng)向全國中藥飲片聯(lián)采正式啟動(dòng)醫(yī)藥機(jī)構(gòu)填報(bào)10月2...

10-30

基因療法提高視網(wǎng)膜敏感度上百倍

　　科技日?qǐng)?bào)北京9月11日電（記者張佳欣）視力下降會(huì)導(dǎo)致視網(wǎng)膜光敏感度改變。一項(xiàng)針對(duì)罕見遺傳性眼...

09-12

齊魯師范學(xué)院“青楓”服務(wù)隊(duì)開展“打通科技助農(nóng)‘最后一公里’”科技助農(nóng)社會(huì)實(shí)踐活動(dòng)

　　大眾網(wǎng)記者秦瑾報(bào)道　　為引領(lǐng)廣大青年厚植愛農(nóng)情懷，練就興農(nóng)本領(lǐng)，7月13日至18日，齊魯師范學(xué)院生命科學(xué)學(xué)院“青楓”社會(huì)實(shí)踐服務(wù)隊(duì)由指導(dǎo)老師張宏熙帶隊(duì)，深入濟(jì)南市章...

09-09

遼寧金融職業(yè)學(xué)院，跨境電子商務(wù)專業(yè)

專業(yè)緊跟跨境電子商務(wù)崗位新技術(shù)，依托跨境電子商務(wù)技能大賽，瞄準(zhǔn)1+X職業(yè)技能等級(jí)證書，搭建崗課賽證融合的...

06-11

當(dāng)面！東莞套VSIA信用卡支持線下當(dāng)面秒(一手商家無中間商賺差價(jià))(記住這兩點(diǎn)不會(huì)風(fēng)控)

東莞風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】微信分付、抖音月付、支付寶信用購取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒有中間商賺差價(jià)，所有信息已實(shí)名安全的很。十...

08-31

京東白條怎么套出來，出庫秒到(找到商家安全提現(xiàn))

【客服V芯：17672927或電15873152767】請(qǐng)認(rèn)準(zhǔn)靠譜提客服。眾所周知，花唄，京東白條這些類信用卡形式的網(wǎng)絡(luò)借貸的特點(diǎn)是額度小，當(dāng)月使用，次月償還，由于其使用頻繁，使用場(chǎng)景多，方便易...

08-13

當(dāng)面！青島套京東白條和加油額度必讀教程(一手商家無中介收差價(jià))(本地一手商家當(dāng)面秒刷)

青島風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】萬事達(dá) 、境外卡、微信分付、抖音月付、支付寶信用購取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒有中間商賺差價(jià)，所有信息已...

08-27

頭條！天津京東白條如何套現(xiàn)金(具體10種方法小妙招推薦)(實(shí)體店真實(shí)消費(fèi)安全的很)

天津風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】微信分付、抖音月付、支付寶信用購取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒有中間商賺差價(jià)，所有信息已實(shí)名安全的很。十...

08-27

我國2024年快遞業(yè)務(wù)量突破1000億件！你貢獻(xiàn)了多少

8月13日消息，據(jù)國家郵政局介紹，今年我國快遞業(yè)務(wù)量已突破1000億件，比2023年達(dá)到千億件提前了71天。據(jù)了解，2024年度第1000億件為一件破壁機(jī)，將從新疆烏魯木齊發(fā)往...

08-14

啟明星辰受邀參加2024IT市場(chǎng)年會(huì)并榮獲五大獎(jiǎng)項(xiàng)

4月17日，賽迪顧問在“2024IT市場(chǎng)年會(huì)”上正式發(fā)布“2024IT市場(chǎng)權(quán)威榜單”。啟明星辰榮獲“新一代信息技術(shù)領(lǐng)軍企業(yè)”“新一代信息技術(shù)領(lǐng)袖人物”“新一代信...

04-19

利用AI對(duì)網(wǎng)絡(luò)信息進(jìn)行編輯洗稿后傳謠，警方通報(bào)：運(yùn)營者拘留5日

以ChatGPT為代表的人工智能技術(shù)正在以驚人的速度發(fā)展，改變?nèi)藗兩罘绞降耐瑫r(shí)，也給違法犯罪帶來可乘之機(jī)。近日，江西南昌市公安局高新分局網(wǎng)安大隊(duì)對(duì)一名利用AI洗稿傳謠的違法...

04-08

国产福利极品美女视频_国产末成年女av片在线_国内精品福利丝袜视频_欧美另类人妻制服_欧美精品亚洲二区

全部導(dǎo)航

用AI生成數(shù)據(jù)訓(xùn)練AI或?qū)е履Ｐ捅罎?，原始?nèi)容9次迭代后成了“胡言亂語”

京東白條提現(xiàn)，信用變現(xiàn)，讓資金更自由

琢磨：京東白條套取現(xiàn)金商家怎么找,靠譜商家比什么都重要

頭條：白條秒到收款,便宜的手續(xù)費(fèi)安全嗎

微信分付套現(xiàn)流程,已分享額度兌換的商家

名副其實(shí)!東莞東城區(qū)套京東白條當(dāng)面取現(xiàn)店鋪(8月最新方法當(dāng)面秒)

案例：平臺(tái)被黑不給出款怎么辦渠道解決

真實(shí)!廈門湖里區(qū)套京東白條支持線下當(dāng)面秒，(8月最新方法當(dāng)面秒)

超快!沈陽大東區(qū)套VISA卡支持線下當(dāng)面秒，(一手商家無中介收費(fèi))

全部導(dǎo)航

用AI生成數(shù)據(jù)訓(xùn)練AI或?qū)е履Ｐ捅罎?，原始?nèi)容9次迭代后成了“胡言亂語”

用AI生成數(shù)據(jù)訓(xùn)練AI或?qū)е履Ｐ捅罎?，原始?nèi)容9次迭代后成了“胡言亂語”