科技日?qǐng)?bào)記者 劉霞
觀看《星球大戰(zhàn)》長(zhǎng)大的一代人可能會(huì)感到失望,他們目光所及之處,仍看不到C-3PO類(lèi)機(jī)器人的影子。那些預(yù)想中具有常識(shí)、能在家里和職場(chǎng)為人類(lèi)提供幫助的人形機(jī)器人何時(shí)會(huì)出現(xiàn)?
人工智能(AI)的快速發(fā)展或許很快會(huì)填補(bǔ)這一空白。
人形機(jī)器人使用OpenAI編程獲得語(yǔ)言和視覺(jué)。
圖片來(lái)源:《自然》網(wǎng)站
《自然》網(wǎng)站近日?qǐng)?bào)道指出,AI和機(jī)器人技術(shù)“聯(lián)姻”,可能是一場(chǎng)將彼此推向新高度的“雙向奔赴”。AI給機(jī)器人灌輸常識(shí),讓其能像人一樣處理各種任務(wù);機(jī)器人則利用身體經(jīng)驗(yàn),幫助AI躍升為“通用AI”。但專(zhuān)家提醒,這條雙向奔赴之路仍面臨諸多挑戰(zhàn),包括收集海量精準(zhǔn)數(shù)據(jù)供機(jī)器人學(xué)習(xí)、應(yīng)對(duì)“喜怒無(wú)?!钡挠布?、解決安全問(wèn)題等。
基礎(chǔ)模型助機(jī)器人“更聰明”
眾多機(jī)器人領(lǐng)域的AI科學(xué)家都希望,未來(lái)機(jī)器人能在更廣泛環(huán)境中自主適應(yīng)。例如,會(huì)幫顧客挑選產(chǎn)品的機(jī)械臂,能陪伴老人的智能人形機(jī)器人等。
當(dāng)看到提示“挑選滅絕動(dòng)物”時(shí),谷歌的RT-2選擇了恐龍雕像。
圖片來(lái)源:谷歌“深度思維”公司
然而,控制這類(lèi)機(jī)器人絕非易事。從OpenAI到谷歌“深度思維”公司,都致力于將多功能學(xué)習(xí)算法(基礎(chǔ)模型)嵌入機(jī)器人,以便其在聊天時(shí)表現(xiàn)得更像人類(lèi)。這些想法的核心是給機(jī)器人灌輸常識(shí),使之能勝任各種任務(wù)。英偉達(dá)公司機(jī)器人技術(shù)營(yíng)銷(xiāo)專(zhuān)家杰拉德·安德魯斯強(qiáng)調(diào),機(jī)器人技術(shù)目前正處于變革的關(guān)鍵時(shí)刻。該公司于3月推出了一款專(zhuān)為人形機(jī)器人設(shè)計(jì)的通用AI模型。谷歌“深度思維”公司則創(chuàng)建了現(xiàn)有最先進(jìn)的機(jī)器人基礎(chǔ)模型之一RT-2,其可以認(rèn)出明星的照片,盡管之前受到的訓(xùn)練中該明星并未出現(xiàn)過(guò)。
研究人員樂(lè)觀地認(rèn)為,基礎(chǔ)模型有助科學(xué)家研發(fā)出可以輔助人類(lèi)勞動(dòng)的通用機(jī)器人。今年2月,人形機(jī)器人公司籌集6.75億美元,以在通用人形機(jī)器人中應(yīng)用OpenAI開(kāi)發(fā)的語(yǔ)言和視覺(jué)模型。一段視頻顯示,機(jī)器人給人一個(gè)蘋(píng)果,以回應(yīng)人們“吃東西”的要求。
多樣數(shù)據(jù)讓機(jī)器人“更有經(jīng)驗(yàn)”
盡管聊天機(jī)器人正在接受來(lái)自互聯(lián)網(wǎng)數(shù)十億單詞訓(xùn)練,但機(jī)器人活動(dòng)的數(shù)據(jù)集還遠(yuǎn)遠(yuǎn)不夠。
數(shù)據(jù)匯集或是一種解決方法。美國(guó)斯坦福大學(xué)機(jī)器人研究專(zhuān)家亞歷山大·卡哈扎特斯基及其同事創(chuàng)建了開(kāi)源數(shù)據(jù)集DROID2,匯集了德國(guó)Franka Robotics公司制造的Franka Panda 7DoF機(jī)械臂約350小時(shí)的視頻數(shù)據(jù),包括浴室、洗衣房、臥室等數(shù)百種環(huán)境的記錄。這種多樣性有助機(jī)器人在全新環(huán)境下更好地執(zhí)行任務(wù)。
加州AI公司Covariant也在努力擴(kuò)大機(jī)器人數(shù)據(jù)的規(guī)模。該公司于2018年開(kāi)始從世界各地的30種機(jī)械臂中收集數(shù)據(jù),其“機(jī)器人基礎(chǔ)模型1”(RFM-1)不僅收集視頻數(shù)據(jù),還收集傳感器讀數(shù)。此類(lèi)數(shù)據(jù)對(duì)于提升機(jī)器人任務(wù)執(zhí)行能力至關(guān)重要,比如讓機(jī)器人知道如何不碰傷香蕉。
此外,許多專(zhuān)家正致力于構(gòu)建3D虛擬現(xiàn)實(shí)環(huán)境,旨在通過(guò)這些環(huán)境來(lái)訓(xùn)練機(jī)器人。元宇宙平臺(tái)(Meta)和英偉達(dá)都在模擬領(lǐng)域投入大量資源,以擴(kuò)大機(jī)器人數(shù)據(jù)的規(guī)模,并建立了復(fù)雜的模擬世界。通過(guò)這些平臺(tái),機(jī)器人能夠在短短幾個(gè)小時(shí)內(nèi)積累相當(dāng)于多年實(shí)際經(jīng)驗(yàn)的數(shù)據(jù)。
硬件和安全問(wèn)題需考慮
許多機(jī)器人專(zhuān)家指出,盡管AI給了機(jī)器人更智慧的“大腦”,但其進(jìn)一步發(fā)展仍面臨諸多挑戰(zhàn)。機(jī)器人很復(fù)雜,而且硬件很容易損壞。
新加坡國(guó)立大學(xué)人機(jī)交互專(zhuān)家哈羅德·索赫說(shuō),機(jī)器人可能需要大量其他類(lèi)型的數(shù)據(jù),如觸覺(jué)或本體感覺(jué)(身體在空間中的位置感)數(shù)據(jù)。這類(lèi)數(shù)據(jù)集目前還不存在,但這是人形機(jī)器人高效工作所必需。
安全性必須認(rèn)真考量。大型語(yǔ)言模型已被證明會(huì)產(chǎn)生錯(cuò)誤、偏見(jiàn),也可能誘騙人類(lèi)或機(jī)器人做一些“壞事”。鑒于此,研發(fā)人員需要給機(jī)器人AI模型中植入一些規(guī)則。機(jī)器人無(wú)疑仍需要大量人工監(jiān)督。
盡管存在一定風(fēng)險(xiǎn),但AI與機(jī)器人的這場(chǎng)雙向奔赴仍值得期待。而AI通過(guò)與機(jī)器人相結(jié)合,增加與現(xiàn)實(shí)世界互動(dòng),有望超越學(xué)習(xí)模式做出預(yù)測(cè),真正理解和推理世界。
責(zé)任編輯: 常麗君本文鏈接:http://www.3ypm.com.cn/news-2-7140-0.html科技創(chuàng)新世界潮|技術(shù)“聯(lián)姻”,雙向奔赴:機(jī)器人或成人工智能領(lǐng)域“弄潮兒”
聲明:本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇:總編輯圈點(diǎn)|新型體外生物神經(jīng)元在線平臺(tái)發(fā)布,包含16個(gè)人腦類(lèi)器官,功耗僅為數(shù)字芯片百萬(wàn)分之一
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請(qǐng)點(diǎn)擊“”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請(qǐng)點(diǎn)擊“”按鈕