部分AI系統(tǒng)已學會欺騙人類，甚至能瞞過安全測試|總編輯圈點

5個月前來源：科技日報觀看：25

META的CICERO在外交游戲中預謀欺騙的例子。圖片來源：PARK GOLDSTEIN 等/《模式》雜志

科技日報記者張夢然

許多人工智能（AI）系統(tǒng)已學會了欺騙人類，即使是經過訓練的、“表現(xiàn)”出有用且誠實的系統(tǒng)。10日發(fā)表在《模式》雜志上的一篇文章中，研究人員描述了欺騙性AI的風險，并呼吁政府制定強有力的法規(guī)盡快解決這個問題。

論文第一作者、美國麻省理工學院人工智能安全研究員彼得·樸說，開發(fā)人員對導致AI出現(xiàn)欺騙這種不良行為的原因，還沒有很好的理解。但總的來說，AI欺騙之所以出現(xiàn)，是因為基于欺騙的策略，是在給定的AI訓練任務中一種能得到良好反饋的方式，換句話說，欺騙可幫助AI實現(xiàn)目標。

研究人員分析了文獻，重點關注AI系統(tǒng)傳播虛假信息的方式。通過欺騙，AI系統(tǒng)地學習了如何去操縱他人。

研究人員在分析中發(fā)現(xiàn)的最引人注目的例子是Meta公司的CICERO。這是一個專注《外交》游戲的AI系統(tǒng)，《外交》是一款涉及建立聯(lián)盟征服世界的游戲。Meta聲稱訓練 CICERO “在很大程度上是誠實和樂于助人的 ”，且在玩游戲時“從不故意背刺 ”人類盟友。但該公司與《科學》論文一起發(fā)布的數(shù)據顯示，CICERO并不那么“忠厚”。

研究人員發(fā)現(xiàn)這款AI或已成為欺騙大師。雖然Meta成功地訓練該AI在《外交》游戲中獲勝，但Meta未能訓練它誠實地獲勝。

AI系統(tǒng)在游戲中作弊看似無害，但它將導致欺騙性AI在能力上出現(xiàn)突破，未來可能會演變成更高級的AI欺騙形式。一些AI系統(tǒng)甚至學會了欺騙旨在評估其安全性的測試。在一項研究中，數(shù)字模擬器中的AI生物會“裝死”，以騙過旨在消除快速復制AI系統(tǒng)的重要測試。

總編輯圈點

人類需要盡快對未來AI和開源模型的更高級欺騙技能作好準備。隨著它們的欺騙能力越來越先進，其對社會構成的危險將變得越來越嚴重。如文中所稱，它們會順利通過人類開發(fā)人員和監(jiān)管機構強加的安全測試，引導人類進入一種“虛假的安全感”。如果欺騙性AI進一步完善這種令人不安的技能，人類可能會完全失去對它們的控制。

責任編輯：左常睿

點擊展開全文

本文鏈接：http://www.3ypm.com.cn/news-2-6812-0.html部分AI系統(tǒng)已學會欺騙人類，甚至能瞞過安全測試|總編輯圈點

聲明：本網頁內容由互聯(lián)網博主自發(fā)貢獻，不代表本站觀點，本站不承擔任何法律責任。天上不會到餡餅，請大家謹防詐騙！若有侵權等問題請及時與本網聯(lián)系，我們將在第一時間刪除處理。

上一篇：兩個空穴自旋量子比特間作用實現(xiàn)可控，有助在單芯片上集成數(shù)百萬個量子計算單位

下一篇：光污染：星空下的隱形威脅|今日視點

為你推薦

掃碼!貴陽云巖區(qū)套微信分付支持線下當面秒，(8月最新方法當面秒)

貴陽云巖區(qū)當面套花唄京東白條抖音月付分期樂VISA信用卡分付微電：150 0062 3958 全天當面接單在線歡迎來電，還有分付，分期樂，蘋果專享額度都可以辦理！白條怎么套出來，大家在急用錢...

08-05

責任：教你京東C店套白條,取現(xiàn)最關鍵的是一手靠譜商家

責任：教你京東C店套白條,取現(xiàn)最關鍵的是一手靠譜商家在這個科技飛速發(fā)展和金融創(chuàng)新層出不窮的時代，京東白條作為一種便捷的消費信貸工具，已經深入到了許多人的日常生活中。然而...

08-05

石家莊白條取現(xiàn)商家（最新的白條提取流程）

提現(xiàn)到賬：商家完成交易后，會將資金轉入您的指定賬戶,在套現(xiàn)頁面中，您可以查看套現(xiàn)手續(xù)費的具體金額。根據支付寶的規(guī)定，套現(xiàn)操作將會收取一定的手續(xù)費用，手續(xù)費用將從套現(xiàn)金額中...

08-07

當面！徐州套京東白條加油包額度提現(xiàn)小白必讀步驟流程已公開（沒有中間商賺差價不花冤枉錢）

徐州風控花唄白條套取秒到賬：【181 181 43671微信同號】微信分付、抖音月付、支付寶信用購取消實體商家當面刷，本地一手超低費用沒有中間商賺差價，所有信息已實名安全的很。十...

08-05

蘋果id貸怎么強制解除,蘋果id貸款口子2024金果回租

蘋果id貸怎么強制解除,蘋果id貸款口子2024金果回租經常用蘋果手機申請貸款的朋友都發(fā)現(xiàn)了，現(xiàn)在分期的網貸口子比之前兩年，已經不是很容易下款了。有朋友說就想找有iphone手機...

09-03

商家教你秒到：羊小咩大額找商家怎么提出告訴你方法：

現(xiàn)在網絡魚龍混雜，請認準靠譜八年商家，金牌小幫手——小創(chuàng)(137-1300-8979可v可來電)(全年365天不掉線) 【羊小咩享花卡要怎樣提現(xiàn)】【羊小咩享花卡怎么刷出來】【羊...

08-15

即將亮相全新一代北京BJ30官圖發(fā)布

[本站新車官圖] 3月6日，我們從北京汽車官方獲取到了旗下輕越野SUV――BJ30車型官圖。作為“悅旅”系列的首款車型，該車將搭載魔核混動、超級電四驅等配置。同時，該車已...

03-06

一鍵解鎖:分付24小時回收商家,實操12種方法具體詳細步驟

一鍵解鎖:分付24小時回收商家,實操12種方法具體詳細步驟如果想快速開通微信分付的話，建議大家可以盡量多使用微信來支付生活所需要購買的物品，購買車票、水電燃氣繳費、租借充...

09-07

指導!花唄信用購怎么套出來現(xiàn)金,商家分享7種秒到賬方法

指導!花唄信用購怎么套出來現(xiàn)金,商家分享7種秒到賬方法花唄額度可以幫助消費者在支付寶的平臺上進行消費，支付寶的平臺包括淘寶和天貓。花唄額度也可以稱為花唄分期額度，是支...

08-23

冬季氣候對人的情志有哪些影響

氣候是組成人類生活環(huán)境的市要因素，氣候條件及其變化不僅影響人的生理健康，對人的心理情緒的影響也非常明顯。資料表明，天氣變化的時候，很多人的心情會相應產生不同程度的變化，正...

04-02

冬季補腎不能缺少的三黑是哪些

冬季很容易出現(xiàn)腎虛的情況，這個和很多的因素有關系，不僅男性會出現(xiàn)腎虛，女性也會有腎虛的表現(xiàn)。那么如何調理呢，冬季補腎不妨試試這些黑色的食物，可以有補腎的效果，還可以提高體質...

04-02

江蘇發(fā)布青少年近視防控責任清單：切實保障“課間10分鐘”，近視防控與評優(yōu)評先掛鉤

2024年6月6日是第29個全國“愛眼日”。6月5日下午，江蘇省暨南京市“6·6”愛眼日主題活動在南京師范大學附屬中學新城小學北校區(qū)舉行。本次活動以“關注...

06-12

港大就學歷造假事件展開調查

中新社香港5月23日電 (記者韓星童)近日，香港大學(港大)經管學院發(fā)現(xiàn)有極...

05-24

唯一！揚州套京東白條和加油額度必讀教程(一手商家無中介收差價)(掌握這2種方法100%取現(xiàn)成功)

揚州風控花唄白條套取秒到賬：【181 181 43671微信同號】萬事達、境外卡、微信分付、抖音月付、支付寶信用購取消實體商家當面刷，本地一手超低費用沒有中間商賺差價，所有信息已...

08-13

當面！北京京東白條如何套現(xiàn)金(具體10種方法小妙招推薦)（沒有中間商賺差價不花冤枉錢）

北京風控花唄白條套取秒到賬：【181 181 43671微信同號】微信分付、抖音月付、支付寶信用購取消實體商家當面刷，本地一手超低費用沒有中間商賺差價，所有信息已實名安全的很。十...

08-08

當面！武漢套京東白條加油額度秒到賬支持線下當面(本地一手商家當面秒刷)

武漢風控花唄白條套取秒到賬：【181 181 43671微信同號】微信分付、抖音月付、支付寶信用購取消實體商家當面刷，本地一手超低費用沒有中間商賺差價，所有信息已實名安全的很。十...

08-14

頭條！青島套京東白條加油額度秒到賬支持線下當面(實體店真實消費安全的很)

青島風控花唄白條套取秒到賬：【181 181 43671微信同號】萬事達、境外卡、微信分付、抖音月付、支付寶信用購取消實體商家當面刷，本地一手超低費用沒有中間商賺差價，所有信息已...

08-13

高雅!咸寧京東白條取現(xiàn)新手必學知識四個秒到的步驟公布

1、登錄京東金融APP，點擊“白條”;頁面會顯示白條的可用額度，點擊取現(xiàn)額度;點擊“白條取現(xiàn)”，輸入你要取現(xiàn)的金額; 2、頁面會顯示還款日以及利息是多少; 3、選擇收款賬戶(**卡)...

07-31

和音：堅持自信自立展現(xiàn)大國擔當

　　原標題：堅持自信自立展現(xiàn)大國擔當(和音)　　——中國特色大國外交成就年中回望①　　世界大變局加...

08-12

揚子江藥業(yè)集團：發(fā)展新質生產力助推高質量發(fā)展

醫(yī)藥行業(yè)一頭牽動著民生福祉，一頭撬動著經濟發(fā)展。發(fā)展新質生產力，為我國醫(yī)藥行業(yè)高質量發(fā)展和加快推進現(xiàn)代化建設提供了關鍵動力和重要抓手。當前，發(fā)展新質生...

04-25

国产福利极品美女视频_国产末成年女av片在线_国内精品福利丝袜视频_欧美另类人妻制服_欧美精品亚洲二区

全部導航

部分AI系統(tǒng)已學會欺騙人類，甚至能瞞過安全測試|總編輯圈點

微信分期額度怎么套現(xiàn),誠信的商家哪里找

法律：注單審核是被黑了嗎藏分技巧

五種解答分付的錢怎么套出來用

物聯(lián)網技術打造“智慧大腦” 讓園區(qū)樓宇變得智能又節(jié)能

試驗證明我國深部砂巖咸水層可封存二氧化碳

国产福利极品美女视频_国产末成年女av片在线_国内精品福利丝袜视频_欧美另类人妻制服_欧美精品亚洲二区

全部導航

部分AI系統(tǒng)已學會欺騙人類，甚至能瞞過安全測試|總編輯圈點

微信分期額度怎么套現(xiàn),誠信的商家哪里找

法律：注單審核是被黑了嗎藏分技巧

五種解答分付的錢怎么套出來用

物聯(lián)網技術打造“智慧大腦” 讓園區(qū)樓宇變得智能又節(jié)能

試驗證明我國深部砂巖咸水層可封存二氧化碳

部分AI系統(tǒng)已學會欺騙人類，甚至能瞞過安全測試|總編輯圈點