觀看《星球大戰(zhàn)》長大的一代人可能會感到失望,他們目光所及之處,仍看不到C-3PO類機(jī)器人的影子。那些預(yù)想中具有常識、能在家里和職場為人類提供幫助的人形機(jī)器人何時會出現(xiàn)?
人工智能(AI)的快速發(fā)展或許很快會填補(bǔ)這一空白。
《自然》網(wǎng)站近日報道指出,AI和機(jī)器人技術(shù)“聯(lián)姻”,可能是一場將彼此推向新高度的“雙向奔赴”。AI給機(jī)器人灌輸常識,讓其能像人一樣處理各種任務(wù);機(jī)器人則利用身體經(jīng)驗,幫助AI躍升為“通用AI”。但專家提醒,這條雙向奔赴之路仍面臨諸多挑戰(zhàn),包括收集海量精準(zhǔn)數(shù)據(jù)供機(jī)器人學(xué)習(xí)、應(yīng)對“喜怒無常”的硬件、解決安全問題等。
基礎(chǔ)模型助機(jī)器人“更聰明”
眾多機(jī)器人領(lǐng)域的AI科學(xué)家都希望,未來機(jī)器人能在更廣泛環(huán)境中自主適應(yīng)。例如,會幫顧客挑選產(chǎn)品的機(jī)械臂,能陪伴老人的智能人形機(jī)器人等。
然而,控制這類機(jī)器人絕非易事。從OpenAI到谷歌“深度思維”公司,都致力于將多功能學(xué)習(xí)算法(基礎(chǔ)模型)嵌入機(jī)器人,以便其在聊天時表現(xiàn)得更像人類。這些想法的核心是給機(jī)器人灌輸常識,使之能勝任各種任務(wù)。英偉達(dá)公司機(jī)器人技術(shù)營銷專家杰拉德·安德魯斯強(qiáng)調(diào),機(jī)器人技術(shù)目前正處于變革的關(guān)鍵時刻。該公司于3月推出了一款專為人形機(jī)器人設(shè)計的通用AI模型。谷歌“深度思維”公司則創(chuàng)建了現(xiàn)有最先進(jìn)的機(jī)器人基礎(chǔ)模型之一RT-2,其可以認(rèn)出明星的照片,盡管之前受到的訓(xùn)練中該明星并未出現(xiàn)過。
研究人員樂觀地認(rèn)為,基礎(chǔ)模型有助科學(xué)家研發(fā)出可以輔助人類勞動的通用機(jī)器人。今年2月,人形機(jī)器人公司籌集6.75億美元,以在通用人形機(jī)器人中應(yīng)用OpenAI開發(fā)的語言和視覺模型。一段視頻顯示,機(jī)器人給人一個蘋果,以回應(yīng)人們“吃東西”的要求。
多樣數(shù)據(jù)讓機(jī)器人“更有經(jīng)驗”
盡管聊天機(jī)器人正在接受來自互聯(lián)網(wǎng)數(shù)十億單詞訓(xùn)練,但機(jī)器人活動的數(shù)據(jù)集還遠(yuǎn)遠(yuǎn)不夠。
數(shù)據(jù)匯集或是一種解決方法。美國斯坦福大學(xué)機(jī)器人研究專家亞歷山大·卡哈扎特斯基及其同事創(chuàng)建了開源數(shù)據(jù)集DROID2,匯集了德國Franka Robotics公司制造的Franka Panda 7DoF機(jī)械臂約350小時的視頻數(shù)據(jù),包括浴室、洗衣房、臥室等數(shù)百種環(huán)境的記錄。這種多樣性有助機(jī)器人在全新環(huán)境下更好地執(zhí)行任務(wù)。
加州AI公司Covariant也在努力擴(kuò)大機(jī)器人數(shù)據(jù)的規(guī)模。該公司于2018年開始從世界各地的30種機(jī)械臂中收集數(shù)據(jù),其“機(jī)器人基礎(chǔ)模型1”(RFM-1)不僅收集視頻數(shù)據(jù),還收集傳感器讀數(shù)。此類數(shù)據(jù)對于提升機(jī)器人任務(wù)執(zhí)行能力至關(guān)重要,比如讓機(jī)器人知道如何不碰傷香蕉。
此外,許多專家正致力于構(gòu)建3D虛擬現(xiàn)實環(huán)境,旨在通過這些環(huán)境來訓(xùn)練機(jī)器人。元宇宙平臺(Meta)和英偉達(dá)都在模擬領(lǐng)域投入大量資源,以擴(kuò)大機(jī)器人數(shù)據(jù)的規(guī)模,并建立了復(fù)雜的模擬世界。通過這些平臺,機(jī)器人能夠在短短幾個小時內(nèi)積累相當(dāng)于多年實際經(jīng)驗的數(shù)據(jù)。
硬件和安全問題需考慮
許多機(jī)器人專家指出,盡管AI給了機(jī)器人更智慧的“大腦”,但其進(jìn)一步發(fā)展仍面臨諸多挑戰(zhàn)。機(jī)器人很復(fù)雜,而且硬件很容易損壞。
新加坡國立大學(xué)人機(jī)交互專家哈羅德·索赫說,機(jī)器人可能需要大量其他類型的數(shù)據(jù),如觸覺或本體感覺(身體在空間中的位置感)數(shù)據(jù)。這類數(shù)據(jù)集目前還不存在,但這是人形機(jī)器人高效工作所必需。
安全性必須認(rèn)真考量。大型語言模型已被證明會產(chǎn)生錯誤、偏見,也可能誘騙人類或機(jī)器人做一些“壞事”。鑒于此,研發(fā)人員需要給機(jī)器人AI模型中植入一些規(guī)則。機(jī)器人無疑仍需要大量人工監(jiān)督。
盡管存在一定風(fēng)險,但AI與機(jī)器人的這場雙向奔赴仍值得期待。而AI通過與機(jī)器人相結(jié)合,增加與現(xiàn)實世界互動,有望超越學(xué)習(xí)模式做出預(yù)測,真正理解和推理世界。
觀看《星球大戰(zhàn)》長大的一代人可能會感到失望,他們目光所及之處,仍看不到C-3PO類機(jī)器人的影子。那些預(yù)想中具有常識、能在家里和職場為人類提供幫助的人形機(jī)器人何時會出現(xiàn)?
人工智能(AI)的快速發(fā)展或許很快會填補(bǔ)這一空白。
《自然》網(wǎng)站近日報道指出,AI和機(jī)器人技術(shù)“聯(lián)姻”,可能是一場將彼此推向新高度的“雙向奔赴”。AI給機(jī)器人灌輸常識,讓其能像人一樣處理各種任務(wù);機(jī)器人則利用身體經(jīng)驗,幫助AI躍升為“通用AI”。但專家提醒,這條雙向奔赴之路仍面臨諸多挑戰(zhàn),包括收集海量精準(zhǔn)數(shù)據(jù)供機(jī)器人學(xué)習(xí)、應(yīng)對“喜怒無常”的硬件、解決安全問題等。
基礎(chǔ)模型助機(jī)器人“更聰明”
眾多機(jī)器人領(lǐng)域的AI科學(xué)家都希望,未來機(jī)器人能在更廣泛環(huán)境中自主適應(yīng)。例如,會幫顧客挑選產(chǎn)品的機(jī)械臂,能陪伴老人的智能人形機(jī)器人等。
然而,控制這類機(jī)器人絕非易事。從OpenAI到谷歌“深度思維”公司,都致力于將多功能學(xué)習(xí)算法(基礎(chǔ)模型)嵌入機(jī)器人,以便其在聊天時表現(xiàn)得更像人類。這些想法的核心是給機(jī)器人灌輸常識,使之能勝任各種任務(wù)。英偉達(dá)公司機(jī)器人技術(shù)營銷專家杰拉德·安德魯斯強(qiáng)調(diào),機(jī)器人技術(shù)目前正處于變革的關(guān)鍵時刻。該公司于3月推出了一款專為人形機(jī)器人設(shè)計的通用AI模型。谷歌“深度思維”公司則創(chuàng)建了現(xiàn)有最先進(jìn)的機(jī)器人基礎(chǔ)模型之一RT-2,其可以認(rèn)出明星的照片,盡管之前受到的訓(xùn)練中該明星并未出現(xiàn)過。
研究人員樂觀地認(rèn)為,基礎(chǔ)模型有助科學(xué)家研發(fā)出可以輔助人類勞動的通用機(jī)器人。今年2月,人形機(jī)器人公司籌集6.75億美元,以在通用人形機(jī)器人中應(yīng)用OpenAI開發(fā)的語言和視覺模型。一段視頻顯示,機(jī)器人給人一個蘋果,以回應(yīng)人們“吃東西”的要求。
多樣數(shù)據(jù)讓機(jī)器人“更有經(jīng)驗”
盡管聊天機(jī)器人正在接受來自互聯(lián)網(wǎng)數(shù)十億單詞訓(xùn)練,但機(jī)器人活動的數(shù)據(jù)集還遠(yuǎn)遠(yuǎn)不夠。
數(shù)據(jù)匯集或是一種解決方法。美國斯坦福大學(xué)機(jī)器人研究專家亞歷山大·卡哈扎特斯基及其同事創(chuàng)建了開源數(shù)據(jù)集DROID2,匯集了德國Franka Robotics公司制造的Franka Panda 7DoF機(jī)械臂約350小時的視頻數(shù)據(jù),包括浴室、洗衣房、臥室等數(shù)百種環(huán)境的記錄。這種多樣性有助機(jī)器人在全新環(huán)境下更好地執(zhí)行任務(wù)。
加州AI公司Covariant也在努力擴(kuò)大機(jī)器人數(shù)據(jù)的規(guī)模。該公司于2018年開始從世界各地的30種機(jī)械臂中收集數(shù)據(jù),其“機(jī)器人基礎(chǔ)模型1”(RFM-1)不僅收集視頻數(shù)據(jù),還收集傳感器讀數(shù)。此類數(shù)據(jù)對于提升機(jī)器人任務(wù)執(zhí)行能力至關(guān)重要,比如讓機(jī)器人知道如何不碰傷香蕉。
此外,許多專家正致力于構(gòu)建3D虛擬現(xiàn)實環(huán)境,旨在通過這些環(huán)境來訓(xùn)練機(jī)器人。元宇宙平臺(Meta)和英偉達(dá)都在模擬領(lǐng)域投入大量資源,以擴(kuò)大機(jī)器人數(shù)據(jù)的規(guī)模,并建立了復(fù)雜的模擬世界。通過這些平臺,機(jī)器人能夠在短短幾個小時內(nèi)積累相當(dāng)于多年實際經(jīng)驗的數(shù)據(jù)。
硬件和安全問題需考慮
許多機(jī)器人專家指出,盡管AI給了機(jī)器人更智慧的“大腦”,但其進(jìn)一步發(fā)展仍面臨諸多挑戰(zhàn)。機(jī)器人很復(fù)雜,而且硬件很容易損壞。
新加坡國立大學(xué)人機(jī)交互專家哈羅德·索赫說,機(jī)器人可能需要大量其他類型的數(shù)據(jù),如觸覺或本體感覺(身體在空間中的位置感)數(shù)據(jù)。這類數(shù)據(jù)集目前還不存在,但這是人形機(jī)器人高效工作所必需。
安全性必須認(rèn)真考量。大型語言模型已被證明會產(chǎn)生錯誤、偏見,也可能誘騙人類或機(jī)器人做一些“壞事”。鑒于此,研發(fā)人員需要給機(jī)器人AI模型中植入一些規(guī)則。機(jī)器人無疑仍需要大量人工監(jiān)督。
盡管存在一定風(fēng)險,但AI與機(jī)器人的這場雙向奔赴仍值得期待。而AI通過與機(jī)器人相結(jié)合,增加與現(xiàn)實世界互動,有望超越學(xué)習(xí)模式做出預(yù)測,真正理解和推理世界。
本文鏈接:http://www.3ypm.com.cn/news-2-5593-0.html機(jī)器人或成人工智能領(lǐng)域“弄潮兒”
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請點(diǎn)擊“”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點(diǎn)擊“”按鈕