圖源:Pixabay
短短一年,大模型的賽制已經(jīng)從資格賽進階至淘汰賽——剛剛邁過資金準入門檻的大模型廠商,火急火燎地卷進了價格戰(zhàn)的漩渦。
這場價格鏖戰(zhàn)始于私募巨頭幻方量化旗下的AI公司DeepSeek。5月6日,DeepSeek宣布開源第二代MoE大模型DeepSeek-V2,標價為GPT-4-Turbo的近1%,百萬tokens只需1元。
智譜緊隨其后,于5月11日稱個人版GLM-3Turbo調(diào)用價格從5元/百萬tokens降低至1元/百萬tokens。
4天后,字節(jié)跳動也加入了價格屠夫的陣營,打著低于行業(yè)平均價99.3%的旗號,宣布豆包Pro 32k模型0.8厘/千tokens,用戶花1元可獲取與5本《新華字典》相當?shù)臄?shù)據(jù)量。
接下來的一周內(nèi),阿里、百度和騰訊等互聯(lián)網(wǎng)大廠和垂直賽道頭部玩家科大訊飛相繼釋放了降價信號。阿里云宣布通義千問9款模型一起降價,其中主力模型Qwen-Long直降97%;百度智能云則直接宣布文心大模型兩大主力模型ERNIE Speed和ERNIE Lite免費;騰訊云則稱,其主力模型之一混元-lite模型的價格從0.008元/千tokens調(diào)整為全面免費,其他模型降幅最高達87.5%;而科大訊飛則表示輕量級模型API永久免費。
實際上,OpenAI也是降價陣營的主力軍,其最新模型GPT-4o價格較GPT-4-Turbo再次減半,這是自2023年初以來OpenAI進行的第4次降價。按照OpenAI的預期,其大模型將以每年50%-75%的幅度繼續(xù)下調(diào)。
回溯出行、本地生活、新能源車等領(lǐng)域,每個賽道的決勝局都少不了價格戰(zhàn)。然而當前大模型盈利前景尚不明朗,價格戰(zhàn)卻早早脫胎于無形,競爭的激烈程度可見一斑。
“價格戰(zhàn)一般存在于行業(yè)中后期,即技術(shù)成熟、市場完善、競爭格局清晰之時,各占山頭的企業(yè)通過壓低價格來搶奪對手的蛋糕?!盇I投資人劉柯(化名)向時代周報記者稱,大模型廠商間的比拼比新能源車領(lǐng)域還要猛烈,他們前期燒掉的資金還沒有收回來,急于投身價格戰(zhàn)無疑要承擔巨大的資金風險。
價格戰(zhàn)的早產(chǎn),將本就金鼓連天的大模型賽道推向白熱化。
近日,估值10億美元的Stability AI資金鏈斷裂,正在尋求被收購;融資近5億美元的Adept,正在與互聯(lián)網(wǎng)大廠洽談出售事宜;清華系大模型公司銜遠科技傳出了人事變動。據(jù)悉,公司創(chuàng)始人周伯文已不再主持公司事物,多位業(yè)務(wù)負責人也在今年春節(jié)前后離職。每日經(jīng)濟新聞報道稱,出現(xiàn)該變動的原因是公司“產(chǎn)品遲遲無法落地,商業(yè)化進展緩慢”。
另時代周報記者從一位AI投資人處獲悉,另一家清華系大模型明星企業(yè)深言科技也正經(jīng)歷發(fā)展瓶頸。該投資人稱,深言科技創(chuàng)始成員大額套現(xiàn),產(chǎn)品研發(fā)進展緩慢,部分團隊核心成員已將主要精力放回學業(yè)。時代周報記者就該問題嘗試聯(lián)系深言科技創(chuàng)始人豈凡超進行核實,截至發(fā)稿未得到回復。
大模型價格下調(diào)已成趨勢,廠商該如何平衡成本與支出?誰會是這場戰(zhàn)役的受益方?腰部大模型企業(yè)又該怎樣迎戰(zhàn)?
價格下跌一大截,技術(shù)前進一小步
大模型廠商的降價手段與互聯(lián)網(wǎng)企業(yè)有所不同。無論是網(wǎng)約車,還是電商和外賣行業(yè),所謂價格戰(zhàn)往往通過巨額補貼來實現(xiàn)。而大模型的降價邏輯是通過技術(shù)手段的驅(qū)動,重構(gòu)生產(chǎn)函數(shù),提升研發(fā)效率來壓低成本。
隨著模型工程化、架構(gòu)、系統(tǒng)手段不斷優(yōu)化,推理成本的減少有效帶動了模型降價。DeepSeek-V2的一篇論文中稱,研發(fā)團隊利用MLA(Multi-head Latent Attention,多頭潛在注意力)結(jié)合 MoE(Mixture-of-Experts 專家混合模型),實現(xiàn)了模型性能跨級別提升,同時減少了計算量、推理現(xiàn)存及成本。
但推理成本的降低,只能算模型廠商們向前邁的一小步。零一萬物CEO李開復此前表示,整個行業(yè)每年降低10倍推理成本是可以期待的,而且必然也應該發(fā)生。“降低模型推理成本并不難,難的是探索模型綜合能力的上限,模型能力提升,才能帶來API商業(yè)模式的持續(xù)增長?!盡inimax創(chuàng)始人閆俊杰也表達了相同觀點。
無奈在模型能力相近的情況下,國內(nèi)廠商只能先簡后繁。
目前,大模型價格戰(zhàn)僅限于推理所用的token降價層面。token是自然語言模型處理文本的最小單位。大模型廠商在訓練出閉源大模型后,會將其 API(應用程序編程接口)出售給開發(fā)者并收取費用。這種主流商業(yè)模式的計費法則一般依靠token所對應的漢字、字母的使用量來計算。
token并非大模型的全部。下游企業(yè)在獲取大模型API后還需通過投喂數(shù)據(jù)、微調(diào)等方式進行模型優(yōu)化和部署,而這些成本依舊昂貴。比如阿里的Qwen-Turbo大模型,進行百萬個tokens推理只需要2元,若繼續(xù)進行訓練,則需要花費30元,具體部署時,每月則需要2萬元。
而百度云的千帆大模型平臺雖然有兩款大模型可以免費調(diào)用,但是模型部署、精調(diào)、評估、數(shù)據(jù)管理、插件調(diào)用等環(huán)節(jié)都需要按量付費。以最基礎(chǔ)的模型部署為例,客戶租賃5天私有資源池至少需要7000元。
時代周報記者還注意到,大模型廠商的降價并沒有覆蓋全線產(chǎn)品。如阿里、百度降價幅度最高的產(chǎn)品都是其輕量模型,主要適用于使用頻次不高、推理量不太大、任務(wù)處理量不太復雜的中小企業(yè)、開發(fā)者在短期內(nèi)使用。
顯然,大模型企業(yè)見縫插針卷價格,很大程度上還是為了制造噱頭吸引用戶,以緩解API這一模式的增長焦慮。
為了提高大模型的API調(diào)用量,大模型廠商始終不遺余力地探索降低AI應用門檻的方法,讓更多的人先用起來。百度云在2023年曾推出了模型開發(fā)工具Model Builder 和AI應用開發(fā)工具AppBuilder。今年4月,其又聯(lián)合有渠道、場景的供應商一起合作服務(wù)客戶,希望進一步拉升文心大模型標準化的API 調(diào)用量。
百度公布的最新數(shù)據(jù)顯示,文心大模型日處理文本2500億 token,另一大廠字節(jié)跳動日均處理 1200億token。這其中很大一部分是公司內(nèi)部業(yè)務(wù)在調(diào)用做AI 應用和業(yè)務(wù)探索。可見,標準化的模型 API 并沒有迎來確定性的增長。
2023年年底,The information稱OpenAI的年度經(jīng)常性收入已經(jīng)達到了16億美元,只不過,如此體量的營收相比其百億美金級別的研發(fā)成本而言也還是杯水車薪。
羊毛出在豬身上,價格戰(zhàn)喂飽云廠商
官方辭令背后,這場價格戰(zhàn)更像是云廠商在另一賽道布下的戰(zhàn)局——用低價的大模型引流,帶動背后公有云服務(wù)的銷售。IDC數(shù)據(jù)顯示,2023上半年中國大陸公有云市場同比增速放緩至15.9%,這一增速在2023下半年進一步放緩至9.5%。
官宣降價后,阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光表示,公有云的技術(shù)紅利和規(guī)模效應,帶來巨大的成本和性能優(yōu)勢,能大幅壓縮模型推理成本、加快推理速度。
隨后,在百川智能新一代基座大模型Baichuan 4的發(fā)布會上,創(chuàng)始人王小川表示,價格戰(zhàn)核心要看背后的商業(yè)模式是什么,如果是做to B服務(wù)的,降價的根本目標不是為了賣大模型本身,而是帶動整套云服務(wù)的銷售。這推動云廠商從偏傳統(tǒng)的服務(wù)模式,進入到一個新戰(zhàn)場。
獵豹移動董事長兼 CEO傅盛也在朋友圈發(fā)文稱,這次價格戰(zhàn),降得最兇的都是有云服務(wù)的大公司,通過大模型來獲取云客戶,羊毛出在豬身上,降得起。
此前,大模型為公有云帶來的增量很小。拿百度舉例,2024年一季度百度云收入為47億元,同比增長12%,其中6.9%的云收入來自外部客戶使用大模型及生成式AI相關(guān)服務(wù)。以此測算,當季生成式AI給百度云帶來的收入約為3.24億元。
阿里云在大模型降價后的第二天就推出了上云優(yōu)惠。包括首次推出5億元算力補貼,以及為200余款云產(chǎn)品制定折扣價,這些產(chǎn)品包括覆蓋GPU、云服務(wù)器、大模型訓練與推理服務(wù)等產(chǎn)品。
“‘公有云+API’被認為是企業(yè)使用大模型更具性價比的模式,哪怕AI利潤暫時比較薄,只要有足夠多的客戶上公有云,云廠商便能吸引用戶購買計算、存儲、網(wǎng)絡(luò)和安全等基礎(chǔ)產(chǎn)品?!笨萍挤治鰩熇钚α馗嬖V時代周報記者。
李笑霖還表示,低價策略主要利好to B的大模型廠商。“隨著越來越多的開發(fā)者被吸引進來,更多新的落地場景將隨之被激活。而隨著公有云和算力規(guī)模效應的逐漸顯現(xiàn),會進一步反向壓縮模型廠商的成本。等待行業(yè)整體豐富起來,模型廠商還將獲取源源不斷的應用產(chǎn)品生態(tài)捆綁以及垂直模型的優(yōu)化方案?!?span style="display:none">BNm即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
“應用產(chǎn)品與通用模型適配得越牢靠,意味著模型廠商與客戶綁定越緊密,下游企業(yè)將持續(xù)為模型廠商支付運營費用,而轉(zhuǎn)換平臺要面臨昂貴的轉(zhuǎn)換成本?!崩钚α匮a充道。
價格戰(zhàn)早產(chǎn),是大模型創(chuàng)企之殤?
大廠氣勢洶洶打價格,大模型創(chuàng)企卻應聲者寥寥。
原因在于,大模型創(chuàng)業(yè)公司如今都認可“雙輪驅(qū)動”戰(zhàn)略,認為只有既做通用模型,又做產(chǎn)品才有未來。但顯然,模型所需的資金、人才和GPU集群都是稀缺資源,產(chǎn)品所需的營銷、渠道也意味著大額消耗。創(chuàng)業(yè)公司們明顯不舍得丟掉手中為數(shù)不多的籌碼投身價格戰(zhàn)。
李開復表示,ofo(共享單車)式的瘋狂降價是雙輸?shù)拇蚍?,大模型公司不會這么不理智,因為技術(shù)還是最重要的,如果是技術(shù)不行,就純粹靠貼錢賠錢去做生意,“我們絕對不會跟這樣的一個定價來做對標”。官網(wǎng)顯示,零一萬物最新發(fā)布的閉源大模型Yi-Large,每百萬tokens價格20元。
王小川則說,這次B端降價,不是生產(chǎn)關(guān)系改變,而是直接做生產(chǎn)力供給,將AI直接供給生產(chǎn)力,“這件事情對我們而言,就是別摻和進去”。
“目前大模型賽道是錯位與同質(zhì)化競爭并存的狀態(tài)。各家技術(shù)差距不大,但也具備相對差異化的產(chǎn)品。好在市場還不成熟,蛋糕尚且未被瓜分,明星創(chuàng)企依然有出頭的機會,但需要找到萬無一失的應對策略?!眲⒖孪驎r代周報記者稱,資本是逐利的,此前歷經(jīng)數(shù)輪融資的創(chuàng)業(yè)公司也到了向投資者遞交成績單的時刻,但技術(shù)大山連綿起伏,商業(yè)化前景也不夠明朗,下半年行業(yè)或?qū)⒚媾R洗牌,一些企業(yè)很可能在此節(jié)點就與賽道無緣了。
傅盛認為,這次大降價基本宣告了大模型創(chuàng)業(yè)公司必須尋找新的商業(yè)模式。
劉柯稱:“創(chuàng)業(yè)公司資金實力不如可以依靠云業(yè)務(wù)造血的大廠,因此一味拼低價顯然是沒有生存空間的,如果要向應用層延伸,或者打造AI原生,也不能忽略大廠的圍追堵截。AI搜索、AI Agent等熱門應用都有大廠在布局,況且現(xiàn)有的大模型能力還不足以支撐一個超級APP的誕生?!?span style="display:none">BNm即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
假如深入B端交付業(yè)務(wù),也意味著大模型創(chuàng)企或?qū)榱擞蠂鴥?nèi)市場,面臨為紛繁的客戶做精細化定制的處境,最終要舍棄掉與AGI相匹配的估值。
劉柯表示,明星創(chuàng)企不妨與專注于某一領(lǐng)域的大模型開發(fā)和服務(wù)平臺,與大廠合作,作為其ISV服務(wù)商,來為大廠提供某些專項場景所需的軟件服務(wù)系統(tǒng),“剩者為王,是大混戰(zhàn)時期的生存哲學?!?span style="display:none">BNm即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
本文鏈接:http://www.3ypm.com.cn/news-2-5856-0.html大模型價格戰(zhàn)開局40天:羊毛出在豬身上,AI獨角獸很受傷
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕