“從通用AI助手到懂你的AI助手”這是訊飛星火4.0的新口號,“通用”的一詞之差,背后是翻天覆地的變化。
科大訊飛副總裁、研究院院長劉聰說,我們研究院考慮的是“剛需”和“代差”兩個因素,做的事情必須有實際的價值,做每一個研究都要和業(yè)務(wù)進(jìn)行對齊,不能閉門造車。
“如果說2023年我們還在追趕、對標(biāo)、摸索,那2024年我們做的就是場景沉淀。訊飛的邏輯是,底層模型得有,更重要的是找落地價值,帶來工作生活學(xué)習(xí)的提效,這是訊飛的目標(biāo)。”
即,通用大模型是訊飛“1+N”戰(zhàn)略的1,是“天花板”立在那里,而現(xiàn)在需要在場景上面下功夫。訊飛的“1+N”,其中“1”代表通用大模型底座,“N”代表將大模型技術(shù)應(yīng)用在教育、醫(yī)療、汽車、辦公、智能硬件等多個行業(yè)領(lǐng)域。
對于大模型,目前有兩種聲音,一波人認(rèn)為中國很差,一波人認(rèn)為中國很強(qiáng),劉聰說確實我們有些地方還有差距,但我們在相當(dāng)部分已經(jīng)很強(qiáng)了,國外很多demo有不少是營銷目的,訊飛在做大模型國產(chǎn)化的相關(guān)工作,到了2024年,可以說我們已經(jīng)摸索出了自己的一條路,開始踏踏實實的做場景、找商業(yè)模型了。
那訊飛的產(chǎn)品方法論是什么?劉聰表示,找PMF(市場匹配度),訊飛基因好、積累好,是厚積薄發(fā),比如,訊飛做了很多年的學(xué)習(xí)機(jī),家長和孩子接受度很高,原來交互性不強(qiáng),現(xiàn)在大模型來了,體驗升級,大家樂見其成。
“歸根結(jié)底,是找到每家企業(yè)自身擅長的地方,做透做扎實,證明自己,有所側(cè)重,在國內(nèi)甚至全球范圍內(nèi)做到最好,最后找到商業(yè)模型。”而做到這一切,我們要有耐心。
劉聰還回應(yīng)近期熱門的具身智能話題,他認(rèn)為,人形雖然很熱,但全面實用化還需要走過正常周期,但大模型帶來了底層能力的提升,在交互能力、知識能力、數(shù)據(jù)能力上帶來好消息,比如之前是機(jī)械臂比較火,而現(xiàn)在大家看到了解決復(fù)雜任務(wù)的可能性。
而對于大模型和小模型的爭論,劉聰談到,大模型小模型的發(fā)展不矛盾,兩種模型是并行發(fā)展的,大模型是“天花板”的探索,小模型的核心是根據(jù)實際情況和成本來搞定場景。他舉例,訊飛把任務(wù)定義為三類,一般難度的任務(wù),比如翻譯、文字、代碼,中小規(guī)模的模型就夠了;中等難度的任務(wù),比如行業(yè)深度場景,用中等模型;高難度任務(wù),比如復(fù)雜推理,數(shù)學(xué)場景,就需要用到更復(fù)雜的大模型。
談及如果決勝大模型的未來,劉聰談到,第一,關(guān)注國際動態(tài),比如我們對于scaling law的進(jìn)展理解非常清晰;第二,結(jié)合實踐,比如在算法方面做測試,結(jié)合實踐來做未來判斷;第三,“以我為主”的賽道聚焦,通用做到第一梯隊之后,做優(yōu)勢領(lǐng)域,即教育,做深做透。
劉聰還犀利評論OpenAI,他表示,GPT-5底座大模型投入巨大,升級周期會變長,局部亮點可能會不斷出現(xiàn),但很難有GPT3.5到4那么大的提升了。
科大訊飛副總裁、研究院院長劉聰與媒體對話精華:
問:訊飛星火V4.0的重點是什么?哪些地方的升級是關(guān)鍵點?
劉聰:我們?nèi)匀谎赜?+N的路徑,繼續(xù)拓展多模態(tài),在底座能力上,重點關(guān)注圖文能力,這是訊飛一直以來的特點。
問:訊飛星火V4.0提出布局AI助手,如何與市面上的產(chǎn)品做差異化?
劉聰:當(dāng)?shù)鬃_(dá)到一定程度,我們關(guān)注的是真正能夠滿足剛需且具有落地價值的產(chǎn)品,這非常關(guān)鍵。每個人都應(yīng)該有一個助手,個性化就變得很重要,真正讓用戶深入使用并產(chǎn)生粘性,這時候他就不愿意再用別的產(chǎn)品了。
訊飛研究院并非一個閉門造車的技術(shù)研究院,我們所有技術(shù)都對應(yīng)業(yè)務(wù)需求。
問:訊飛的大模型是如何迭代的?
劉聰:我們一直在摸索scaling law是否符合我們的預(yù)期,摸索這條線。但我們更加關(guān)注的是模型的場景化,把“N”做透,深入解決系統(tǒng)化問題,這非常關(guān)鍵。在多模態(tài)中,我將重點關(guān)注OCR,以確保OCR做到最好。當(dāng)然,我們還有國產(chǎn)化的工作需要完成。
問:訊飛在場景落地過程中,如何找PMF(市場匹配度)?
劉聰:大模型之前,訊飛是人工智能企業(yè)中較少有的,能夠真正把技術(shù)實現(xiàn)產(chǎn)品落地的企業(yè)。當(dāng)年在教育場景下還沒有to c用戶,我們每天與老師們在一起打磨,做到對這個場景非常熟悉,不能僅憑想象和拍腦袋。有了大模型之后,你會發(fā)現(xiàn)作文批改比之前厲害很多,除了修改字詞錯誤,還可以處理比喻和修辭方面的問題。
這就是我們找PMF之所以準(zhǔn)確,是源于過去25年我們在場景上的積累。這是我們的邏輯。
問:今年具身智能較為火爆,訊飛也推出了雙足機(jī)器人,您如何看待這個機(jī)會?
劉聰:在資本界,最近一年多,大模型、人形機(jī)器人是最熱的。但站在真正實用化的角度,所有技術(shù)發(fā)展一樣,仍然需要正常周期。
可以肯定的是,大模型出來后,人形機(jī)器人可以做更多事情了,之前都是機(jī)械臂,做重復(fù)的事情。而現(xiàn)在,處理復(fù)雜任務(wù)成為可能。
問:您如何看待“小模型”話題?大家開始更關(guān)注小模型可以做的事情。
劉聰:我們一直強(qiáng)調(diào)小模型時代,并不意味著不再關(guān)注大模型、小模型就足夠了。其實核心技術(shù)原理是大模型在更新,大模型先找到天花板,再優(yōu)化小模型。小模型的不斷進(jìn)步依賴于大模型的發(fā)展。
問:語音轉(zhuǎn)譯,很多AI產(chǎn)品都具備,訊飛的競爭力在哪里?
劉聰:首先,通用效果更為重要,我們涉及到中英文以及其他語種。第二,做到“信達(dá)雅”大家都還有很大空間,我們發(fā)布的科研助手已經(jīng)體現(xiàn)了對學(xué)術(shù)論文全面翻譯的能力,第三,訊飛擅長語音翻譯、同傳翻譯。后續(xù)會有相關(guān)新產(chǎn)品和大家見面。
問:從整個產(chǎn)業(yè)看,怎么來定義目前大模型的發(fā)展階段?
劉聰:我們現(xiàn)在的狀態(tài)是經(jīng)過兩年對標(biāo),正處于厚積薄發(fā)的狀態(tài),已經(jīng)進(jìn)入了一個需要比拼耐力和耐心的過程。中國大模型已從追趕、對標(biāo)走向自主原創(chuàng)。
接下來的提升可能在“局部”,Sora非常驚艷,但并沒有像GPT剛出來時的顛覆性。對于訊飛而言,我們的視頻優(yōu)先級較低,我們需要找到自己的優(yōu)勢場景和定位,形成自我造血,透徹地提高產(chǎn)品價值。
問:中美大模型差距是否正在縮小?
劉聰:毫無疑問,中美在大模型之間的差距正在縮小,無論是正式的榜單還是實際任務(wù),大家都可以體驗。
問:訊飛星火從2022年12月正式立項到現(xiàn)在一年多了,您個人狀態(tài)和之前有什么不同?
劉聰:相當(dāng)充實,發(fā)際線依然在。我現(xiàn)在是“首席演示官”,每場“演出”都站在臺前,以前都是在幕后。
本文鏈接:http://www.3ypm.com.cn/news-2-21719-0.html信用額度提現(xiàn)實操:微信分付,變現(xiàn)金的簡便方法
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕