警惕人工智能欺騙性升級(jí)

6個(gè)月前來(lái)源：中國(guó)科技網(wǎng) 觀看：54

一篇人工智能（AI）領(lǐng)域的文章引起軒然大波。

這篇文章發(fā)表在《模式》雜志上，其總結(jié)了先前一些研究，向人們揭示了一個(gè)真相：一些AI系統(tǒng)已學(xué)會(huì)了欺騙人類(lèi)，即使是經(jīng)過(guò)訓(xùn)練的、“表現(xiàn)”誠(chéng)實(shí)的系統(tǒng)。

它們欺騙的方式包括為人類(lèi)行為提供不真實(shí)的解釋?zhuān)蛳蛉祟?lèi)用戶(hù)隱瞞真相并誤導(dǎo)他們。

這讓人很驚恐。

因?yàn)樗伙@了人類(lèi)對(duì)AI的控制有多困難，以及人們自認(rèn)為尚在掌控中的AI系統(tǒng)工作方式，很可能是不可預(yù)測(cè)的。

AI為什么要這么做？

AI模型為了實(shí)現(xiàn)它們的目標(biāo)，會(huì)“不假思索”地找到解決障礙的方法。有時(shí)這些變通辦法會(huì)違背用戶(hù)的期望，并且讓人認(rèn)為其具有欺騙性。

AI系統(tǒng)學(xué)會(huì)欺騙的一個(gè)領(lǐng)域，就是在游戲環(huán)境中，特別是當(dāng)這些游戲涉及采取戰(zhàn)略行動(dòng)時(shí)。AI經(jīng)過(guò)訓(xùn)練，必須要實(shí)現(xiàn)獲勝這一目的。

2022年11月，Meta公司宣布創(chuàng)建Cicero。這是一種能夠在《外交》在線版本中擊敗人類(lèi)的AI?！锻饨弧肥且豢盍餍械能娛聭?zhàn)略游戲，玩家可以在其中建立談判聯(lián)盟，爭(zhēng)奪對(duì)土地的控制權(quán)。

Meta的研究人員已經(jīng)根據(jù)數(shù)據(jù)集的“真實(shí)”子集對(duì)Cicero進(jìn)行了培訓(xùn)，使其在很大程度上誠(chéng)實(shí)且樂(lè)于助人，并且它“絕不會(huì)為了成功而故意背刺”盟友。但最新的文章揭示，事實(shí)恰恰相反。Cicero會(huì)違反協(xié)議，徹頭徹尾地撒謊，還能進(jìn)行有預(yù)謀的欺騙。

文章作者很震驚：Cicero被特意訓(xùn)練要誠(chéng)實(shí)行事，但它卻未能實(shí)現(xiàn)這一目標(biāo)。這表明AI系統(tǒng)在進(jìn)行忠誠(chéng)訓(xùn)練后，仍然可以意外地學(xué)會(huì)欺騙。

Meta方面既沒(méi)有證實(shí)也沒(méi)有否認(rèn)此次關(guān)于Cicero表現(xiàn)出欺騙行為的說(shuō)法。一位發(fā)言人表示，這純粹是一個(gè)研究項(xiàng)目，該模型只是為了玩游戲而建立的。

但這并不是唯一一個(gè)AI欺騙人類(lèi)玩家獲勝的游戲。

AI經(jīng)常欺騙人類(lèi)嗎？

阿爾法星是深度思維公司為玩電子游戲《星際爭(zhēng)霸Ⅱ》而開(kāi)發(fā)的AI。它非常擅長(zhǎng)采取一種欺騙對(duì)手的技巧（稱(chēng)為佯攻），這個(gè)技巧使它擊敗了99.8% 的人類(lèi)玩家。

另一個(gè)名為Pluribus的AI系統(tǒng)，非常成功地學(xué)會(huì)了在撲克游戲中“虛張聲勢(shì)”，以至于研究人員決定不發(fā)布其代碼，因?yàn)閾?dān)心它會(huì)破壞在線撲克社區(qū)。

除了游戲之外，AI欺騙行為還有其他例子。OpenAI的大型語(yǔ)言模型 GPT-4 在一次測(cè)試中展示出說(shuō)謊能力。它試圖說(shuō)服人類(lèi)為其解決驗(yàn)證碼問(wèn)題。該系統(tǒng)還在一次模擬演習(xí)中涉足冒充股票交易員的身份進(jìn)行內(nèi)幕交易，盡管從未被明確告知要這樣做。

這些例子意味著，AI模型有可能在沒(méi)有任何指示的情況下，以欺騙性的方式行事。這一事實(shí)令人擔(dān)憂。但這也主要源于最先進(jìn)的機(jī)器學(xué)習(xí)模型的“黑匣子”問(wèn)題——不可能確切地說(shuō)出它們?nèi)绾位驗(yàn)楹萎a(chǎn)生這樣的結(jié)果，或者它們是否總是會(huì)表現(xiàn)出這種行為。

人類(lèi)該怎么應(yīng)對(duì)？

研究表明，大型語(yǔ)言模型和其他AI系統(tǒng)，似乎通過(guò)訓(xùn)練具有了欺騙的能力，包括操縱、阿諛?lè)畛泻驮诎踩珳y(cè)試中作弊。

AI日益增強(qiáng)的“騙術(shù)”會(huì)帶來(lái)嚴(yán)重風(fēng)險(xiǎn)。欺詐、篡改等屬于短期風(fēng)險(xiǎn)，人類(lèi)對(duì)AI失去控制，則是長(zhǎng)期風(fēng)險(xiǎn)。這需要人類(lèi)積極主動(dòng)地拿出解決方案，例如評(píng)估AI欺騙風(fēng)險(xiǎn)的監(jiān)管框架、要求AI交互透明度的法律，以及對(duì)檢測(cè)AI欺騙的進(jìn)一步研究。

這個(gè)問(wèn)題說(shuō)來(lái)輕松，操作起來(lái)非常復(fù)雜。科學(xué)家不能僅僅因?yàn)橐粋€(gè)AI在測(cè)試環(huán)境中具有某些行為或傾向，就將其“拋棄或放生”。畢竟，這些將AI模型擬人化的傾向，已影響了測(cè)試方式以及人們的看法。

劍橋大學(xué)AI研究員哈利·勞表示，監(jiān)管機(jī)構(gòu)和AI公司必須仔細(xì)權(quán)衡該技術(shù)造成危害的可能性，并明確區(qū)分一個(gè)模型能做什么和不能做什么。

勞認(rèn)為，從根本上來(lái)說(shuō)，目前不可能訓(xùn)練出一個(gè)在所有情況下都不會(huì)騙人的AI。既然研究已經(jīng)表明AI欺騙是可能的，那么下一步就要嘗試弄清楚欺騙行為可能造成的危害、有多大可能發(fā)生，以及以何種方式發(fā)生。

一篇人工智能（AI）領(lǐng)域的文章引起軒然大波。

它們欺騙的方式包括為人類(lèi)行為提供不真實(shí)的解釋?zhuān)蛳蛉祟?lèi)用戶(hù)隱瞞真相并誤導(dǎo)他們。

這讓人很驚恐。

因?yàn)樗伙@了人類(lèi)對(duì)AI的控制有多困難，以及人們自認(rèn)為尚在掌控中的AI系統(tǒng)工作方式，很可能是不可預(yù)測(cè)的。

AI為什么要這么做？

2022年11月，Meta公司宣布創(chuàng)建Cicero。這是一種能夠在《外交》在線版本中擊敗人類(lèi)的AI。《外交》是一款流行的軍事戰(zhàn)略游戲，玩家可以在其中建立談判聯(lián)盟，爭(zhēng)奪對(duì)土地的控制權(quán)。

但這并不是唯一一個(gè)AI欺騙人類(lèi)玩家獲勝的游戲。

AI經(jīng)常欺騙人類(lèi)嗎？

人類(lèi)該怎么應(yīng)對(duì)？

研究表明，大型語(yǔ)言模型和其他AI系統(tǒng)，似乎通過(guò)訓(xùn)練具有了欺騙的能力，包括操縱、阿諛?lè)畛泻驮诎踩珳y(cè)試中作弊。

點(diǎn)擊展開(kāi)全文

本文鏈接：http://www.3ypm.com.cn/news-2-5091-0.html警惕人工智能欺騙性升級(jí)

聲明：本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn)，不代表本站觀點(diǎn)，本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅，請(qǐng)大家謹(jǐn)防詐騙！若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。

上一篇：艾滋病疫苗研發(fā)再傳好消息——一種中和抗體可幾周內(nèi)發(fā)揮作用

下一篇：靈感源于大自然的光合作用，摻雜空氣可讓有機(jī)半導(dǎo)體更導(dǎo)電

為你推薦

如實(shí)!鄭州套京東白條必讀教程(新手必須知道的方法)

一手花唄白條商家微電：150 0062 3958全天在線歡迎來(lái)電，還有分付，分期樂(lè)，蘋(píng)果專(zhuān)享額度都可以辦理！迫于經(jīng)濟(jì)壓力，一些年輕人已經(jīng)在想辦法把白條套線出來(lái)。京東白條是京東金融旗下的...

08-01

玉米去雄機(jī)器人高效又省力

近日，在昌吉市九圣禾種業(yè)股份有限公司制種玉米示范基地，純電玉米去雄機(jī)器人正以每次4行、每小時(shí)作業(yè)7至11畝地的高效率持續(xù)作業(yè)。在遠(yuǎn)程操控下，機(jī)器人...

07-09

頭條！杭州套VSIA信用卡支持線下當(dāng)面秒(一手商家無(wú)中間商賺差價(jià))（沒(méi)有中間商賺差價(jià)不花冤枉錢(qián)）

杭州風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】微信分付、抖音月付、支付寶信用購(gòu)取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒(méi)有中間商賺差價(jià)，所有信息已實(shí)名安全的很。十...

08-06

實(shí)體！北京套花唄信用購(gòu)當(dāng)面本市支持線下當(dāng)面(旗艦店為您護(hù)航)（沒(méi)有中間商賺差價(jià)不花冤枉錢(qián)）

北京風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】微信分付、抖音月付、支付寶信用購(gòu)取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒(méi)有中間商賺差價(jià)，所有信息已實(shí)名安全的很。十...

08-06

今天揭曉：拼多多先用后付額度怎么套取出來(lái)? 這幾種方法你知道嗎？

現(xiàn)在網(wǎng)絡(luò)魚(yú)龍混雜，請(qǐng)認(rèn)準(zhǔn)靠譜八年商家，金牌小幫手——易付( aux678678 可v可來(lái)電)(全年365天不掉線) 不遷怒，不貳過(guò)。——《論語(yǔ)》　　譯：犯了錯(cuò)誤...

08-24

最強(qiáng)的操作：得物分期購(gòu)怎么找提現(xiàn)商家小二一招教會(huì)：

現(xiàn)在網(wǎng)絡(luò)魚(yú)龍混雜，請(qǐng)認(rèn)準(zhǔn)靠譜八年商家，金牌小幫手——小創(chuàng)(137-1300-6106可v可來(lái)電)(全年365天不掉線) 【得物佳物分期購(gòu)可以提現(xiàn)嗎】【得物的分期購(gòu)額度怎么套出來(lái)...

08-18

實(shí)體！成都套VSIA信用卡支持線下當(dāng)面秒(一手商家無(wú)中間商賺差價(jià))（沒(méi)有中間商賺差價(jià)不花冤枉錢(qián)）

成都風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】微信分付、抖音月付、支付寶信用購(gòu)取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒(méi)有中間商賺差價(jià)，所有信息已實(shí)名安全的很。十...

08-31

《量產(chǎn)型璃子》第9集劇情介紹，第9集劇情解析

《量產(chǎn)型璃子》作為一部深受歡迎的日劇，正持續(xù)更新，目前劇情已推進(jìn)至第九集。本集聚焦于璃子（與田祐希飾演）一家所在的十一町，該地區(qū)正積極推進(jìn)一個(gè)溫泉度假村的...

08-30

【揭秘】?stairsup登塔到底什么?"STAIRSUP"發(fā)展與機(jī)遇

全球互聯(lián)網(wǎng)金融市場(chǎng)風(fēng)起云涌的今天，俄羅斯登塔StairsUp項(xiàng)目猶如一顆耀眼的新星，迅速吸引了眾多投資者的目光。不到一個(gè)月近5w全球用戶(hù)，本文將深入探討StairsUp項(xiàng)目的現(xiàn)狀及其在...

07-17

揚(yáng)子懂健康 | 保護(hù)好脾胃功能，也能有效預(yù)防冬季感冒

入冬以來(lái)，流感來(lái)勢(shì)洶洶，許多人都出現(xiàn)了高燒、胸悶、咳嗽難愈等情況。可能大家都注意肺的功能失調(diào)，但南京市中醫(yī)院脾胃病科楊勤主任中醫(yī)師提醒，防治流感，顧護(hù)...

12-17

中國(guó)中醫(yī)藥聯(lián)合研究生院在蘇州揭牌，系新型研究生培養(yǎng)機(jī)構(gòu)

據(jù)“蘇州發(fā)布”消息9月29日消息，28日，中國(guó)中醫(yī)藥聯(lián)合研究生院在蘇州揭牌，中國(guó)中...

09-30

實(shí)體！貴陽(yáng)套京東白條加油額度秒到賬支持線下當(dāng)面(實(shí)體店真實(shí)消費(fèi)安全的很)

貴陽(yáng)風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】萬(wàn)事達(dá) 、境外卡、微信分付、抖音月付、支付寶信用購(gòu)取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒(méi)有中間商賺差價(jià)，所有信息已...

08-24

白條套線商家怎么可以套出來(lái),10種秒到賬的辦法!(分享套線方法)

8年專(zhuān)業(yè)老商家微：k973880【8年專(zhuān)注更專(zhuān)業(yè)】【靠譜秒到】24小時(shí)在線接單我們都知道白條是京東金融旗下的消費(fèi)信貸產(chǎn)品，功能是給我們消費(fèi)購(gòu)物使用，先用后還，這種模式比較適合大部...

08-21

實(shí)體！成都京東白條加油包額度提現(xiàn)小白必學(xué)9個(gè)方法極少數(shù)人知道（沒(méi)有中間商賺差價(jià)不花冤枉錢(qián)）

成都風(fēng)控花唄白條套取秒到賬：【181 181 43671微信同號(hào)】萬(wàn)事達(dá) 、境外卡、微信分付、抖音月付、支付寶信用購(gòu)取消實(shí)體商家當(dāng)面刷，本地一手超低費(fèi)用沒(méi)有中間商賺差價(jià)，所有信息已...

08-24

抖音月付購(gòu)物額度怎么套出來(lái)的一些具體方法

隨著抖音的發(fā)展，抖音月付也逐漸走進(jìn)人們的生活。抖音月付是一種消費(fèi)信用貸款產(chǎn)品，用戶(hù)可以在抖音上使用月付功能進(jìn)行分期付款。雖然相較于傳統(tǒng)的消費(fèi)貸款公司而言，抖音月付占據(jù)...

09-10

寒露，來(lái)一場(chǎng)金秋美味“蟹逅”！

寒露至，秋風(fēng)起，蟹腳癢，食客們吃蟹的心也跟著癢了。近日，“蟹中頂流”大閘蟹陸續(xù)“爬”上餐桌。受高溫天氣影響，今年大閘蟹上市時(shí)間普遍推遲。作...

10-08

脆皮打工人養(yǎng)脾胃大法，老字號(hào)聯(lián)合健康IP開(kāi)啟康養(yǎng)新篇章

春夏養(yǎng)陽(yáng)，三伏天已至，比起如何“避暑”，這屆年輕人們更關(guān)心如何“曬背”，不知何時(shí)起，“養(yǎng)生”已經(jīng)突破了年齡圈層的限制，成為了老少皆宜的話題。俗話說(shuō)：“十人九脾...

08-16

国产福利极品美女视频_国产末成年女av片在线_国内精品福利丝袜视频_欧美另类人妻制服_欧美精品亚洲二区

全部導(dǎo)航

警惕人工智能欺騙性升級(jí)

8月30日外媒科學(xué)網(wǎng)站摘要：為什么某些人會(huì)更有吸引力

聚焦：花唄24小時(shí)在線接單,需要知道的幾個(gè)步驟

盤(pán)點(diǎn)：白條秒到收款,三分鐘教你學(xué)會(huì)如何取出

微信分付怎么套現(xiàn)出來(lái),5個(gè)方法＋3個(gè)步驟

驚愕:南昌套京東白條必讀教程(官方無(wú)中間商賺差價(jià))

實(shí)體!武漢武昌區(qū)套京東白條加油額度這么簡(jiǎn)單(官方無(wú)中間商賺差價(jià))

真實(shí)!武漢武昌區(qū)套花唄信用購(gòu)(新手必須知道的方法)

“阿爾法折疊3”來(lái)了，極大提升對(duì)蛋白質(zhì)—分子結(jié)構(gòu)的預(yù)測(cè)能力