圖源:Unsplash
繼今年2月發(fā)布開(kāi)源模型MiniCPM之后,短短70多天,清華系A(chǔ)I公司“面壁智能”又在4月11日下午推出了MiniCPM 2系列端側(cè)模型。
新品主要包括:MiniCPM-V 2.0多模態(tài)模型,20億參數(shù)的MiniCPM-2B-128k長(zhǎng)文本模型,MiniCPM-MoE-8x2B MoE(混合專家)模型,以及12億參數(shù)規(guī)模的MiniCPM-1.2B模型——比上一代推理速度提升38%,成本下降60%。
同日,面壁智能向時(shí)代周報(bào)透露,公司已完成新一輪數(shù)億元融資,由春華創(chuàng)投、華為哈勃領(lǐng)投,北京市人工智能產(chǎn)業(yè)投資基金等跟投,知乎作為戰(zhàn)略股東持續(xù)跟投支持。本輪融資將用于人才引入,大模型底層算力與數(shù)據(jù)基礎(chǔ)構(gòu)建,和大模型落地三個(gè)方向。光源資本擔(dān)任獨(dú)家財(cái)務(wù)顧問(wèn)。
面壁智能成立于2022年8月,專注大模型技術(shù)創(chuàng)新與應(yīng)用轉(zhuǎn)化。其創(chuàng)始團(tuán)隊(duì)主要來(lái)自于清華大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室(THUNLP),公司CEO李大海兼任知乎CTO(首席技術(shù)官);另一位公司聯(lián)合創(chuàng)始人劉知遠(yuǎn),則是清華大學(xué)計(jì)算機(jī)系副教授、博士生導(dǎo)師,研究方向?yàn)橛?jì)算機(jī)自然語(yǔ)言處理。
據(jù)李大海介紹,面壁智能科研團(tuán)隊(duì)有100多人,清華、北大畢業(yè)的員工數(shù)量占比高達(dá)80%,平均年齡為28歲。其中工程團(tuán)隊(duì)還有來(lái)自阿里、字節(jié)、百度等國(guó)內(nèi)外知名公司的 AI 人才。
將“高效”視作產(chǎn)品關(guān)鍵詞
面壁智能CEO李大海向時(shí)代周報(bào)表示:“高效大模型是通向 AGI 的更現(xiàn)實(shí)的路徑。”他稱,面壁智能將打造更高效的Scaling Law增長(zhǎng)曲線,實(shí)現(xiàn)同等參數(shù)性能更優(yōu)、同等性能參數(shù)更小效果。
Scaling Law增長(zhǎng)曲線即模型的最終性能主要與訓(xùn)練計(jì)算量、模型參數(shù)量和數(shù)據(jù)大小三者相關(guān),而與模型的具體結(jié)構(gòu)(層數(shù)、深度、寬度)基本無(wú)關(guān)。研發(fā)人員可以通過(guò)它在固定資源預(yù)算中,如額定的GPU數(shù)量、訓(xùn)練數(shù)據(jù)量或是訓(xùn)練時(shí)長(zhǎng)下,匹配模型的最佳大小,且無(wú)需經(jīng)歷昂貴的試錯(cuò)。
面壁智能的思路就是,在遵循scaling law的情況下,對(duì)模型的細(xì)節(jié)進(jìn)行更好的優(yōu)化,使其在同等成本下達(dá)到更好的效果。
面壁智能團(tuán)隊(duì)曾于2020年12月發(fā)布國(guó)內(nèi)首個(gè)中文大模型CPM-1。截至目前,公司正規(guī)劃構(gòu)建Al Agent智能體協(xié)作平臺(tái),推出基于群體智能的“大模型+Agent”應(yīng)用——ChatDev智能軟件開(kāi)發(fā)平臺(tái)。同時(shí),To C消費(fèi)端,面壁智能的基座模型產(chǎn)品“面壁露卡Luca”已獲審批并對(duì)外開(kāi)放。
過(guò)去一年,瞄準(zhǔn)AGI這一方向,面壁智能將“高效”視作產(chǎn)品關(guān)鍵詞,推進(jìn)大模型技術(shù)發(fā)展和市場(chǎng)落地。
在2024年2月1日的發(fā)布會(huì)上,面壁智能對(duì)標(biāo)Mistral發(fā)布了訓(xùn)練數(shù)據(jù)規(guī)模近1T、參數(shù)規(guī)模僅2B的模型——聚焦于適配端側(cè)硬件的端側(cè)大模型MiniCPM-2B。目前,MiniCPM-2B在比GPU計(jì)算吞吐量低的CPU上可實(shí)現(xiàn)運(yùn)行,有效降低了推理成本。同時(shí),即便將大小壓縮75%,MiniCPM的性能也能做到基本無(wú)損耗。
面壁智能向時(shí)代周報(bào)透露,此次發(fā)布的國(guó)內(nèi)MiniCPM 2四款模型,整體對(duì)標(biāo)的是谷歌Gemma-7B、OpenAI GPT-4V、Mistral-7B、Llama2等國(guó)外開(kāi)源模型。MiniCPM 2模型在同等性能參數(shù)更小、同等參數(shù)性能更強(qiáng),超越Mistral-7B、谷歌Gemma、Llama2-13B、 ChatGLM3-6B等,并且170萬(wàn)tokens的推理成本僅需1元。
從商業(yè)化層面來(lái)看,面壁當(dāng)下更側(cè)重企業(yè)端的產(chǎn)品驗(yàn)證。目前,面壁已與招商銀行、數(shù)科網(wǎng)維、知乎等合作伙伴,將大模型與Agent技術(shù)部署落地于金融、教育、政務(wù)、智能終端等應(yīng)用場(chǎng)景。
李大海稱,盡管很難預(yù)測(cè)未來(lái)行業(yè)發(fā)展,但隨著時(shí)間推移,公司會(huì)出現(xiàn)“分層”,大模型應(yīng)用可能會(huì)百花齊放,然而通用千億大模型不會(huì)太多,可能只有極少數(shù)的幾家公司最終能突出重圍。
硬件廠商爭(zhēng)奪端側(cè)大模型
誕生不滿一年,“端側(cè)大模型”概念已被一眾硬件廠商視作競(jìng)爭(zhēng)的新籌碼。
今年2月,OPPO 創(chuàng)始人兼CEO陳明永在內(nèi)部信中開(kāi)宗明義地指出:未來(lái)五年,Al對(duì)手機(jī)行業(yè)的影響完全可以比肩當(dāng)年智能手機(jī)。從行業(yè)發(fā)展階段來(lái)看,AI手機(jī)也將成為繼功能機(jī)、智能手機(jī)之后,手機(jī)行業(yè)的第三階段。
于過(guò)去十余年都未享受到技術(shù)創(chuàng)新紅利的PC廠商而言,AI被放在了更加重要的位置。
聯(lián)想、華為、榮耀、蘋(píng)果、微軟等紛紛布局AI PC生態(tài),扎堆亮相國(guó)際消費(fèi)電子盛會(huì)CES 2024。此外,芯片廠商也聞風(fēng)而動(dòng),高通、聯(lián)發(fā)科、英特爾和AMD相繼發(fā)布了能夠支持在手機(jī)端運(yùn)行百億參數(shù)大模型的手機(jī)芯片。
“從消費(fèi)者角度來(lái)看,端側(cè)大模型避開(kāi)了云端、網(wǎng)絡(luò)速度的限制,可獨(dú)當(dāng)一面地提升手機(jī)、電腦的運(yùn)行體驗(yàn),并且能保證用戶數(shù)據(jù)安全可控?!笨萍挤治鰩熇钣跋驎r(shí)代周報(bào)稱。
從國(guó)內(nèi)大模型企業(yè)發(fā)展角度來(lái)看,李影認(rèn)為,通用大模型往往需要暴力地消耗算力,端側(cè)大模型的出現(xiàn)或?qū)⑾鈬?guó)外“算力制裁”的風(fēng)險(xiǎn),不失為國(guó)內(nèi)企業(yè)實(shí)現(xiàn)彎道超車的機(jī)會(huì)點(diǎn)。
但一個(gè)無(wú)法避開(kāi)的挑戰(zhàn)是,手機(jī)與PC若支持本地化AI模型,意味著其需要更快的傳輸速度、更大的儲(chǔ)存容量和帶寬。因此,解決“算”和“存”的壓力,將模型做“小”做“高效”,成為“百模大戰(zhàn)”卷向千億參數(shù)后的又一難題。
李影表示,把大模型落在端側(cè)并進(jìn)行后續(xù)市場(chǎng)推廣,需要考慮到大模型的形態(tài)是不是足夠小,成本是不是足夠低,性能是不是足夠強(qiáng)。
她稱:“目前的通用大模型很大一部分無(wú)法打破這些掣肘。130億參數(shù)規(guī)模的Llama 2跑在手機(jī)端非常吃力,但10億參數(shù)量Stable Diffusion可以在搭載驍龍芯片的手機(jī)上正常運(yùn)行?!?span style="display:none">uNM即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
“當(dāng)1.2B規(guī)模的模型應(yīng)用于手機(jī)和PC端,意味著大模型離用戶更近,從而能出現(xiàn)更廣泛的落地場(chǎng)景。”李影告訴時(shí)代周報(bào)。
本文鏈接:http://www.3ypm.com.cn/news-2-4242-0.html又一清華系A(chǔ)I公司獲數(shù)億元融資!面壁智能李大海:只有極少數(shù)千億模型能突圍
聲明:本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請(qǐng)點(diǎn)擊“”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請(qǐng)點(diǎn)擊“”按鈕