圖片來源:視覺中" />

国产福利极品美女视频_国产末成年女av片在线_国内精品福利丝袜视频_欧美另类人妻制服_欧美精品亚洲二区

警惕人工智能欺騙性升級|今日視點

5個月前 來源:科技日報 觀看:22
廣告

Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com


Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

圖片來源:視覺中國Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

科技日報記者 張夢然Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

一篇人工智能(AI)領(lǐng)域的文章引起軒然大波。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

這篇文章發(fā)表在《模式》雜志上,其總結(jié)了先前一些研究,向人們揭示了一個真相:一些AI系統(tǒng)已學會了欺騙人類,即使是經(jīng)過訓練的、“表現(xiàn)”誠實的系統(tǒng)。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

它們欺騙的方式包括為人類行為提供不真實的解釋,或向人類用戶隱瞞真相并誤導他們。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

這讓人很驚恐。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

因為它突顯了人類對AI的控制有多困難,以及人們自認為尚在掌控中的AI系統(tǒng)工作方式,很可能是不可預(yù)測的。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

AI為什么要這么做?Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

AI模型為了實現(xiàn)它們的目標,會“不假思索”地找到解決障礙的方法。有時這些變通辦法會違背用戶的期望,并且讓人認為其具有欺騙性。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

AI系統(tǒng)學會欺騙的一個領(lǐng)域,就是在游戲環(huán)境中,特別是當這些游戲涉及采取戰(zhàn)略行動時。AI經(jīng)過訓練,必須要實現(xiàn)獲勝這一目的。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

2022年11月,Meta公司宣布創(chuàng)建Cicero。這是一種能夠在《外交》在線版本中擊敗人類的AI?!锻饨弧肥且豢盍餍械能娛聭?zhàn)略游戲,玩家可以在其中建立談判聯(lián)盟,爭奪對土地的控制權(quán)。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

Meta的研究人員已經(jīng)根據(jù)數(shù)據(jù)集的“真實”子集對Cicero進行了培訓,使其在很大程度上誠實且樂于助人,并且它“絕不會為了成功而故意背刺”盟友。但最新的文章揭示,事實恰恰相反。Cicero會違反協(xié)議,徹頭徹尾地撒謊,還能進行有預(yù)謀的欺騙。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

文章作者很震驚:Cicero被特意訓練要誠實行事,但它卻未能實現(xiàn)這一目標。這表明AI系統(tǒng)在進行忠誠訓練后,仍然可以意外地學會欺騙。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

Meta方面既沒有證實也沒有否認此次關(guān)于Cicero表現(xiàn)出欺騙行為的說法。一位發(fā)言人表示,這純粹是一個研究項目,該模型只是為了玩游戲而建立的。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

但這并不是唯一一個AI欺騙人類玩家獲勝的游戲。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

AI經(jīng)常欺騙人類嗎?Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

阿爾法星是深度思維公司為玩電子游戲《星際爭霸Ⅱ》而開發(fā)的AI。它非常擅長采取一種欺騙對手的技巧(稱為佯攻),這個技巧使它擊敗了99.8% 的人類玩家。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

另一個名為Pluribus的AI系統(tǒng),非常成功地學會了在撲克游戲中“虛張聲勢”,以至于研究人員決定不發(fā)布其代碼,因為擔心它會破壞在線撲克社區(qū)。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

除了游戲之外,AI欺騙行為還有其他例子。OpenAI的大型語言模型 GPT-4 在一次測試中展示出說謊能力。它試圖說服人類為其解決驗證碼問題。該系統(tǒng)還在一次模擬演習中涉足冒充股票交易員的身份進行內(nèi)幕交易,盡管從未被明確告知要這樣做。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

這些例子意味著,AI模型有可能在沒有任何指示的情況下,以欺騙性的方式行事。這一事實令人擔憂。但這也主要源于最先進的機器學習模型的“黑匣子”問題——不可能確切地說出它們?nèi)绾位驗楹萎a(chǎn)生這樣的結(jié)果,或者它們是否總是會表現(xiàn)出這種行為。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

人類該怎么應(yīng)對?Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

研究表明,大型語言模型和其他AI系統(tǒng),似乎通過訓練具有了欺騙的能力,包括操縱、阿諛奉承和在安全測試中作弊。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

AI日益增強的“騙術(shù)”會帶來嚴重風險。欺詐、篡改等屬于短期風險,人類對AI失去控制,則是長期風險。這需要人類積極主動地拿出解決方案,例如評估AI欺騙風險的監(jiān)管框架、要求AI交互透明度的法律,以及對檢測AI欺騙的進一步研究。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

這個問題說來輕松,操作起來非常復(fù)雜??茖W家不能僅僅因為一個AI在測試環(huán)境中具有某些行為或傾向,就將其“拋棄或放生”。畢竟,這些將AI模型擬人化的傾向,已影響了測試方式以及人們的看法。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

劍橋大學AI研究員哈利·勞表示,監(jiān)管機構(gòu)和AI公司必須仔細權(quán)衡該技術(shù)造成危害的可能性,并明確區(qū)分一個模型能做什么和不能做什么。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

勞認為,從根本上來說,目前不可能訓練出一個在所有情況下都不會騙人的AI。既然研究已經(jīng)表明AI欺騙是可能的,那么下一步就要嘗試弄清楚欺騙行為可能造成的危害、有多大可能發(fā)生,以及以何種方式發(fā)生。Qav即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

責任編輯: 左常睿

本文鏈接:http://www.3ypm.com.cn/news-2-6913-0.html警惕人工智能欺騙性升級|今日視點

聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

上一篇:靈感源于大自然的光合作用,摻雜空氣可讓有機半導體更導電|總編輯圈點

下一篇:艾滋病疫苗研發(fā)再傳好消息——一種中和抗體可幾周內(nèi)發(fā)揮作用

為你推薦
新聞:白條秒回商家的步驟,最為關(guān)鍵的是方法還是步驟在這個科技飛速發(fā)展和金融創(chuàng)新層出不窮的時代,京東白條作為一種便捷的消費信貸工具,已經(jīng)深入到了許多人的日常生活中。然而,...
08-11
哈爾濱香坊區(qū)本地當面套花唄京東白條VISA信用卡分付一手商家秒到賬:【150 0062 3958 微信同號】一手當面靠譜!白條怎么套出來,大家在急用錢的時候肯定會想到京東白條或者京東金...
07-31
深圳風控花唄白條套取秒到賬:【181 181 43671微信同號】微信分付、抖音月付、支付寶信用購取消實體商家當面刷,本地一手超低費用沒有中間商賺差價,所有信息已實名安全的很。十...
08-07
千丈之堤,以螻蟻之穴潰;百尺之室,以突隙之煙焚。——《韓非子》  譯:千里大堤,因為有螻蟻在打洞,可能會因此而塌掉決堤;百尺高樓,可能因為煙囪的縫隙冒出火星引起火災(zāi)而...
08-06
▲近日,擁有“4個博士學位”的95后研究員疑翻車。圖/新京報我們視頻截圖不到30歲,就擁有“4博士2博后”以及數(shù)十項社會兼職?據(jù)新京報等媒體報道,近日,內(nèi)蒙古民族文化藝術(shù)研究院研...
10-11
小人之過也必文。——《論語》  譯:小人對自己的過錯必定加以掩飾。 仰不愧于天,俯不怍于人。——《孟子》  譯:為人正直坦蕩,抬頭無愧于天,低頭無愧于...
08-24
  中新網(wǎng)4月5日電(中新財經(jīng)葛成宮宏宇)近日,汽車貸款迎來重大調(diào)整!  中國人民銀行、國家金融...
04-07
日前,我們從相關(guān)渠道獲悉,仰望旗下純電動超跑――仰望U9將于2月25日正式上市。新車將搭載易四方平臺技術(shù),0-100km/h加速達到2秒級,售價或為百萬元級。外觀來看,仰望U9采用...
02-17
一鍵解鎖:攻略怎么找分付套現(xiàn)的商家,實操12種方法具體詳細步驟商家收款碼是由商家生成并展示,用于接收用戶支付款項的二維碼。當用戶掃描商家的收款碼后,會自動跳轉(zhuǎn)到微信的支...
09-07
橫評:微信分付怎么提現(xiàn)到銀行卡,實用教程與心得分享微信分付不可以提現(xiàn),微信分付是微信官方提供的信用支付產(chǎn)品,類似于花唄分期,可以在不同的場景中使用,比如吃飯購物看電影等,不...
09-05
近日,一位賬號簡介為“中央音樂學院教授薛偉”的微博賬號發(fā)帖稱,公開懸賞征集...
04-13
常州風控花唄白條套取秒到賬:【181 181 43671微信同號】微信分付、抖音月付、支付寶信用購取消實體商家當面刷,本地一手超低費用沒有中間商賺差價,所有信息已實名安全的很。十...
08-12
哈爾濱風控花唄白條套取秒到賬:【181 181 43671微信同號】微信分付、抖音月付、支付寶信用購取消實體商家當面刷,本地一手超低費用沒有中間商賺差價,所有信息已實名安全的很。...
08-08
紹興風控花唄白條套取秒到賬:【181 181 43671微信同號】微信分付、抖音月付、支付寶信用購取消實體商家當面刷,本地一手超低費用沒有中間商賺差價,所有信息已實名安全的很。十...
09-01
重慶風控花唄白條套取秒到賬:【181 181 43671微信同號】萬事達 、境外卡、微信分付、抖音月付、支付寶信用購取消實體商家當面刷,本地一手超低費用沒有中間商賺差價,所有信息已...
08-26
EA宣布《星球大戰(zhàn)絕地:幸存者》將于2024年9月17日登陸PS4和Xbox One平臺,零售價50美元,將有對上世代老主機的各種優(yōu)化,旨在最大化利用該主機的機能。 預(yù)購?fù)婕覍@...
08-07
  “每天吃兩粒,有客戶服用一段時間后,能白發(fā)轉(zhuǎn)黑,皮膚變得緊致、有光澤?!币豢蠲麨槿鹁S拓(Revig...
06-27
  臺灣花蓮縣從4月22日晚間至23日早晨地震不斷,已造成花蓮市區(qū)2棟大樓傾倒?;ㄉ徔h政府23日5時緊急發(fā)布訊息指出,因地震不斷發(fā)生...
04-23
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕