今年人工智能大會,以特斯拉的二代人形機(jī)器人Optimus為代表,宇樹科技、傅利葉、達(dá)闥、樂聚、開普勒、天鏈等十?dāng)?shù)家人形機(jī)器人廠商均展出了自家的“得意之作”" />
人形機(jī)器人火了。
今年人工智能大會,以特斯拉的二代人形機(jī)器人Optimus為代表,宇樹科技、傅利葉、達(dá)闥、樂聚、開普勒、天鏈等十?dāng)?shù)家人形機(jī)器人廠商均展出了自家的“得意之作”,狠狠秀了一輪“肌肉”。
雖然有機(jī)構(gòu)預(yù)測,今年會成為人形機(jī)器人的量產(chǎn)元年。但達(dá)闥機(jī)器人(下稱“達(dá)闥”)副總裁、廣州公司總經(jīng)理王恩璽在接受時代周報記者專訪時卻表示,目前“量產(chǎn)”只是一個噱頭。人形機(jī)器人僅僅被造出來了,但還沒到能解具體決問題的階段。
而且他表示,在商業(yè)化落地過程中,人形機(jī)器人的價格也是廠商們需要考慮的一大問題。
達(dá)闥是人形機(jī)器人行業(yè)的頭部公司之一,在2019年B輪融資后躋身為獨(dú)角獸企業(yè)。在WAIC 2024會場,時代周報記者對達(dá)闥副總裁王恩璽進(jìn)行了專訪,對人形機(jī)器人的商業(yè)化進(jìn)展和落地難題等相關(guān)問題進(jìn)行探討。
王恩璽。圖源:受訪者供圖
為什么非“人形”不可?
時代周報:機(jī)器人并不是一個新鮮的概念。在很久之前,工廠中就利用機(jī)械臂完成重復(fù)單一的任務(wù)。為何我們還要發(fā)展人形機(jī)器人?
王恩璽:機(jī)器人的概念確實(shí)存在很長時間了。從整個機(jī)器人的分類來看,大概包括工業(yè)機(jī)器人、服務(wù)機(jī)器人和特種機(jī)器人。某些機(jī)器人是為特定場景而服務(wù)的,如工業(yè)機(jī)械臂、爬蟲機(jī)器人、清潔機(jī)器人等。
但是,人類創(chuàng)造機(jī)器人的最終目標(biāo),是為了將人類從骯臟、復(fù)雜、繁瑣的功能中解脫出來,最直接的方法就是能完全代替這個人,首先外形設(shè)計要像人。在人類的生產(chǎn)生活中,各種工具的發(fā)明、流程的制定都是以人為核心的,當(dāng)你使用一個人形機(jī)器人去替代人的時候,它對周圍環(huán)境的影響是最小的,也無需對現(xiàn)有的生產(chǎn)場景和工具做出較大變動。
另一方面,從新物種的角度來看,人類對特異的物種有天生的排斥感。那么當(dāng)人形機(jī)器人未來應(yīng)用于居家、服務(wù)、養(yǎng)老行業(yè),從而進(jìn)入到千家萬戶,人類一定更能接受和自己外形相似的機(jī)器人一起生活。如果機(jī)器人長著三條手臂,即使技術(shù)上不存在問題,工作起來也更高效,但人類可能還是很難接受該物種。
時代周報:目前,有哪些場景比較適合人形機(jī)器人應(yīng)用?
王恩璽:對此問題,業(yè)內(nèi)如今其實(shí)有一定共識。2023年11月,工業(yè)和信息化部印發(fā)《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見》,里面提到了兩類場景。一類是面向民爆、救援等等特殊環(huán)境,強(qiáng)化人形機(jī)器人本體安全防護(hù)能力、復(fù)雜任務(wù)智慧生成與高精度操作能力,降低作業(yè)人員危險性。
另一類場景是聚焦3C、汽車等制造業(yè)重點(diǎn)領(lǐng)域,打造人形機(jī)器人示范產(chǎn)線和工廠。這也是為何如今汽車制造變成了人形機(jī)器人行業(yè)較為重要的發(fā)力點(diǎn),汽車的整個生產(chǎn)制造流程較為清晰,也相對容易定義出哪些可替代人類工作的場景。當(dāng)企業(yè)把汽車制造“玩”明白后,下一步就可以做3C了。
例如去年比亞迪就投資人形機(jī)器人公司智元機(jī)器人,上汽在今年同樣投資了該公司;去年小米、優(yōu)必選等成立北京人形機(jī)器人創(chuàng)新中心;我們達(dá)闥也正在和廣汽談合作。
而當(dāng)人形機(jī)器人ToB場景打磨成熟后,就能夠逐步進(jìn)入到家庭,服務(wù)居家養(yǎng)老,技術(shù)是一步步演進(jìn)的。
圖源:時代周報記者攝
大模型如何上機(jī)?
時代周報:這屆人工智能大會,“大模型+機(jī)器人”對機(jī)器人泛化能力的提升是大家較為關(guān)注的熱點(diǎn)。達(dá)闥的人形機(jī)器人上是否也搭載了大模型?是如何部署的?
王恩璽:達(dá)闥成立之初就是從云端大腦開發(fā)起的,我們認(rèn)為機(jī)器人的算力、智力一定是運(yùn)行在云端,配合5G低延遲的網(wǎng)絡(luò)。大模型出現(xiàn)之前,2017年我們利用多模態(tài)算法,訓(xùn)練人形機(jī)器人的視覺、語音、動作和運(yùn)動。大模型出現(xiàn)后,我們就基于原有算法技術(shù)的積累做了針對性的模型微調(diào)和優(yōu)化,并通過我們自己的機(jī)器人收集的各類型數(shù)據(jù)做了大量訓(xùn)練,在2023年發(fā)布了RobotGPT。
我認(rèn)為人形機(jī)器人想在復(fù)雜的場景完成任務(wù)的話,光靠端側(cè)的算力是不夠的。雖然如今部分設(shè)備如手機(jī)、PC等,能夠植入經(jīng)過充分訓(xùn)練后的、參數(shù)較小的模型,并在端側(cè)做推理。但是當(dāng)面臨復(fù)雜的場景或如居家服務(wù)中的開放性場景,人形機(jī)器人需要很泛化的能力,光靠端側(cè)大模型的能力是不足的,需要云端大腦來支撐訓(xùn)練和推理。
時代周報:但是,當(dāng)人形機(jī)器人居家使用時候,將家庭私人的數(shù)據(jù)上傳到云端,是否會存在隱私泄露的問題?
王恩璽:數(shù)據(jù)安全是一個永恒的話題。保證數(shù)據(jù)安全的方法通常有兩種,一是通過各種先進(jìn)技術(shù)保證數(shù)據(jù)不被竊取和泄露。當(dāng)然,在這方面有時存在“道高一尺魔高一丈”的情況,沒有什么技術(shù)是永遠(yuǎn)奏效的。所以我認(rèn)為數(shù)據(jù)安全不完全是一個技術(shù)問題,而是一個管理問題。
二是建立保障或信任機(jī)制。我們的策略是跟運(yùn)營商合作,將云端大腦部署在運(yùn)營商,如中國移動的云平臺上,通過國企背書來確保數(shù)據(jù)隱私安全。
未來,我們設(shè)計的商業(yè)模式是通過運(yùn)營商的渠道向每個家庭租賃人形機(jī)器人,就好比每家使用機(jī)頂盒上網(wǎng),一千兆寬帶每月200塊錢,未來可能租賃一臺人形機(jī)器人每月花1500-3000元。機(jī)器人收集的數(shù)據(jù)將保存在運(yùn)營商的云平臺上,就如同手機(jī)電話數(shù)據(jù)存儲在運(yùn)營商的數(shù)據(jù)庫中。
“量產(chǎn)”還是一個噱頭
時代周報:有機(jī)構(gòu)預(yù)測,今年會成為人形機(jī)器人的量產(chǎn)元年,你同意這種看法嗎?
王恩璽:對于“量產(chǎn)”這個詞我是有疑義的。量產(chǎn)的前提是,一個產(chǎn)品有非常具體的使用場景,能夠解決該場景下的問題,而且有非常明確的產(chǎn)品功能說明書,這和我們購買任何一件消費(fèi)類產(chǎn)品是一致的。這個時候的量產(chǎn)才是有意義的。
那么現(xiàn)在人形機(jī)器人所謂的“量產(chǎn)”,我認(rèn)為只是聲明人形機(jī)器人被造出來了。人形機(jī)器人還沒有到具體能解決什么問題的階段,例如在ToB場景下,是否能在生產(chǎn)線幫忙擰螺絲、打膠、搬東西等,都沒有明確。所以我認(rèn)為現(xiàn)在談“量產(chǎn)”,還只是一個噱頭。
包括從這次人工智能大會會場,你會看到大家比拼的不是人形機(jī)器人在哪個場景做了什么工作,從端到端實(shí)現(xiàn)場景閉環(huán)等,而是展示機(jī)器人能走路,能揮手等功能,這是人形機(jī)器人的基本功能要求。從原型機(jī)的推出,到具體能解決什么場景問題,是目前整個業(yè)界都在努力攻破的。
時代周報:現(xiàn)在人形機(jī)器人的發(fā)展還存在哪些技術(shù)難點(diǎn)?
王恩璽:硬件上,人形機(jī)器人關(guān)節(jié)的發(fā)展,架構(gòu)設(shè)計,是否更加靈活,能夠?qū)崿F(xiàn)抓取、翻轉(zhuǎn)等類人的更精準(zhǔn)的操作等,這是在運(yùn)動控制領(lǐng)域需要持續(xù)迭代的。
另外一個難點(diǎn)體現(xiàn)在利用大模型技術(shù)對人形機(jī)器人做各種場景的訓(xùn)練。自大模型技術(shù)出現(xiàn)后,人形機(jī)器人在某些場景下能夠做出的動作已經(jīng)超出了原有的訓(xùn)練模式。例如通過視頻學(xué)習(xí)、人工示教、強(qiáng)化學(xué)習(xí)等,能夠讓機(jī)器人快速掌握在該場景下應(yīng)該做出的動作,并且泛化到其他場景,這就是大模型所具備的優(yōu)勢,大模型的發(fā)展與人形機(jī)器人息息相關(guān)。
其實(shí),我更傾向于認(rèn)為人形機(jī)器人的發(fā)展沒有卡脖子的技術(shù),沒有不可攻克的難題,但它需要時間迭代,變得更加成熟、更加精細(xì)、也更加精準(zhǔn)。
時代周報:價格高昂也是人形機(jī)器人實(shí)現(xiàn)商業(yè)化落地的阻礙之一。能否舉例說明,怎樣定價一臺人形機(jī)器人才能使其更具購買力?
王恩璽:我跟一些汽車制造廠商交流過,如果人形機(jī)器人真的能替代人工,他們希望產(chǎn)品的定價最高限制不超過20萬。因?yàn)楝F(xiàn)在生產(chǎn)線上的工人的工資大概在8000-1萬左右,一年開支大概是10-15萬塊錢,人形機(jī)器人不知疲憊,可以24小時持續(xù)干活,所以價格可以稍高,但超過20萬也不劃算了。
但如今人形機(jī)器人的造價基本上是百萬級別的。這是因?yàn)槟壳叭诵螜C(jī)器人的造價還沒有考慮到未來銷量。公司們剛剛把人形機(jī)器人造出來,更多考慮其功能的實(shí)現(xiàn),還沒開始重視成本的優(yōu)化。如果對銷量沒有合理預(yù)期的話,就無法從供應(yīng)鏈的維度降低成本。
時代周報:從商業(yè)邏輯來看,你認(rèn)為人形機(jī)器人企業(yè)如何能加速商業(yè)化落地的進(jìn)程?
王恩璽:現(xiàn)在人形機(jī)器人需要更多場景開放去推進(jìn)其發(fā)展。市場上對人形機(jī)器人的使用是持開放態(tài)度的,無論是老齡化社會的到來,還是制造業(yè)降低成本的需求催化下,社會對于人形機(jī)器人的期望值很高。
對于人形機(jī)器人公司而言,目前最大的成本是時間成本。因?yàn)榇蜷_和解決一個具體場景的問題,需要研發(fā)、測試,迭代等反復(fù)過程,如果企業(yè)無法在短時間內(nèi)找到落地場景,可能會導(dǎo)致其生存都難以為繼。
現(xiàn)在整個產(chǎn)業(yè)界也在爭先恐后、優(yōu)勝劣汰的賽馬進(jìn)程中。我特別認(rèn)同馬斯克的一句話:創(chuàng)新的速度比創(chuàng)新更重要。
本文鏈接:http://www.3ypm.com.cn/news-2-8081-0.html專訪達(dá)闥副總裁王恩璽:國產(chǎn)人形機(jī)器人已無技術(shù)瓶頸,但量產(chǎn)仍是噱頭
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請點(diǎn)擊“”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點(diǎn)擊“”按鈕