rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
2024年末,一位科技創(chuàng)業(yè)者火了。來(lái)源 | 投資家(ID:touzijias)2024年末,一位科技創(chuàng)業(yè)者火了。rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
2025年初,這位創(chuàng)業(yè)者再度爆火。rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
近日,中國(guó)科技行業(yè)因一位85后年輕人現(xiàn)身《新聞聯(lián)播》,徹底爆了。他以AI初創(chuàng)公司深度求索(DeepSeek)創(chuàng)始人的身份罕見(jiàn)參加了一場(chǎng)國(guó)家超高規(guī)格座談會(huì),并現(xiàn)場(chǎng)發(fā)言。rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
他發(fā)言的照片,迅速流傳于各類(lèi)社交平臺(tái)。所有人都想聽(tīng)聽(tīng),他分享了哪些可能改變?nèi)蚩萍嘉磥?lái)趨勢(shì)的深度見(jiàn)解。這位年輕人,就是把開(kāi)源模型做到全球第一,性?xún)r(jià)比超越估值1570億美元獨(dú)角獸OpenAI的浙大天才,梁文鋒。他和DeepSeek曾一夜轟動(dòng)美國(guó)硅谷、震驚全球。而梁文鋒及團(tuán)隊(duì)開(kāi)發(fā)的大模型“DeepSeek-V3”則被海外稱(chēng)作,“來(lái)自東方的神秘力量”。rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
一rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
梁文鋒與DeepSeek的故事還要從2024年末發(fā)生的兩件大事說(shuō)起。第一件事,轟動(dòng)硅谷、震驚全球。2024年12月,一家名叫DeepSeek的杭州初創(chuàng)公司經(jīng)過(guò)技術(shù)迭代與升級(jí),發(fā)布了全新一代大模型,“DeepSeek-V3”。由于這款大模型太過(guò)好用,在A(yíng)I發(fā)燒友圈子傳播后,傳到了海外社交平臺(tái)、技術(shù)論壇,引發(fā)了海外網(wǎng)友的連連稱(chēng)贊。有海外網(wǎng)友直接拿“DeepSeek-V3”和OpenAI發(fā)布的“GPT-4o”進(jìn)行比較,結(jié)論是,“兩款產(chǎn)品不相上下”。得出這樣的結(jié)論,美國(guó)硅谷的技術(shù)大牛坐不住了,他們覺(jué)得,“網(wǎng)友描述太過(guò)夸張”。于是,紛紛把“DeepSeek-V3”拿來(lái)使用,挑點(diǎn)毛病。挑來(lái)挑去,差點(diǎn)“跪了”。結(jié)果,技術(shù)大牛挑了不少“GPT-4o”的毛病。這件事,在硅谷傳播,成了美國(guó)科技圈的熱門(mén)討論議題。有幾位硅谷AI技術(shù)扛把子,開(kāi)了個(gè)分析會(huì)。研究“這個(gè)新模型是怎么做到的?”會(huì)上一些專(zhuān)家頭大了,分析半天,給出結(jié)論,“很強(qiáng),但投入成本肯定會(huì)超過(guò)OpenAI”。緊接著,美國(guó)媒體打了硅谷的臉。據(jù)報(bào)道,“DeepSeek-V3”來(lái)自一家名叫DeepSeek的中國(guó)初創(chuàng)公司。令人驚訝的是,DeepSeek-V3的投入研發(fā)費(fèi)用,只花了558萬(wàn)美元?!半y以想象,一款性能比肩GPT-4o的大模型,訓(xùn)練成本不到GPT-4o的1/20,硅谷卻還在自以為是?!?/strong>看到報(bào)道,硅谷心態(tài)炸了,科技地震。有人感到羞愧,有人給出了客觀(guān)聲音。OpenAI早期成員安德烈·卡帕西說(shuō),“DeepSeek-V3的出現(xiàn),意味著,今后也許不需要大型GPU集群來(lái)訓(xùn)練前沿的大語(yǔ)言模型了。”Scale AI華裔CEO亞歷山大·王感嘆,“DeepSeek-V3更強(qiáng)”。讓硅谷更加不可思議的是,訓(xùn)練成本極低的“DeepSeek-V3”只用了2048張H100的GPU集群,且用時(shí)僅53天。一位美國(guó)AI行業(yè)研究員稱(chēng),“同等水平下,哪怕是全球AI第一梯隊(duì)的頭部公司,至少也要用到1.6萬(wàn)張以上的GPU進(jìn)行訓(xùn)練,真的不可思議,太不可思議了?!?/strong>一位推特網(wǎng)友表示,“美國(guó)科技故步自封,殊不知勤勞的中國(guó)跑到了前面?!?/strong>伴隨各種驚訝之聲,“DeepSeek-V3”在大模型發(fā)燒友的推動(dòng)下火遍全球,被認(rèn)為是“來(lái)自東方的神秘力量”。美國(guó)CNBC電視臺(tái)如此評(píng)價(jià)硅谷科技地震,“一種新模式,讓整個(gè)山谷都嗡嗡作響。”二rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
全球炸鍋了,DeepSeek卻在國(guó)內(nèi)保持低調(diào)。過(guò)去一兩年,AI是全球最寵溺風(fēng)口,沒(méi)有之一。眾多細(xì)分賽道中,大模型熱度靠前,是大廠(chǎng)、資本投入規(guī)模最大賽道。國(guó)內(nèi),大廠(chǎng)對(duì)大模型表現(xiàn)出了極度偏愛(ài),開(kāi)創(chuàng)了“大模型盛世”。早期大模型的參與者就有百度、華為、騰訊、阿里巴巴、京東、字節(jié)跳動(dòng)、網(wǎng)易等巨無(wú)霸。其中,百度開(kāi)發(fā)了“文心一言”,華為有“盤(pán)古”,騰訊弄“混元”,阿里巴巴打造“通義千問(wèn)”,京東上線(xiàn)“言犀”。不光自己干,素有“中國(guó)三大產(chǎn)業(yè)資本CVC”之稱(chēng)的騰訊、阿里巴巴、京東,相繼投了一批大模型,間接折騰出牽動(dòng)一二級(jí)市場(chǎng)、概念滿(mǎn)天飛的“百模大戰(zhàn)”。“百模大戰(zhàn)”釋放了“無(wú)窮大”的市場(chǎng)增量空間,資本、高校、創(chuàng)業(yè)者、科學(xué)家密集參與。大模型賽道繼續(xù)分化,拆出多個(gè)分支,包括通用大模型、行業(yè)大模型、垂直大模型3大應(yīng)用分類(lèi),每個(gè)大分類(lèi)有小分類(lèi)。根據(jù)百度文庫(kù)一份報(bào)告顯示,國(guó)內(nèi)大模型數(shù)量超200個(gè),覆蓋芯片、新能源汽車(chē)、智能制造、醫(yī)療健康、航空航天、數(shù)字產(chǎn)業(yè)、金融等50多個(gè)領(lǐng)域。拼殺到2024年,資本聚集、表現(xiàn)出眾的5只獨(dú)角獸分別是:智譜AI、月之暗面(Kimi)、百川智能、MiniMax、零一萬(wàn)物。試想,在這么“卷”的大模型賽道,想要出名也不容易。反觀(guān)DeepSeek,在競(jìng)爭(zhēng)激烈的賽道,十分冷靜。第二件事,才讓DeepSeek漸漸浮出水面。第二件事便是,網(wǎng)傳雷軍天價(jià)招人。就在“DeepSeek-V3”轟動(dòng)硅谷不久,“頂流科技網(wǎng)紅”小米創(chuàng)始人雷軍出手了,要做小米大模型。雷軍出手非同凡響,“年薪千萬(wàn)元,挖角95后AI天才少女”話(huà)題引爆熱搜。雷軍想挖的人,叫羅福莉,她碩士畢業(yè)于北大計(jì)算語(yǔ)言學(xué)研究所計(jì)算語(yǔ)言學(xué)專(zhuān)業(yè),是AI行業(yè)的天才少女。不過(guò),后來(lái)羅福莉向媒體說(shuō),“還在考慮”。媒體“瘋狂搶流”,挖出了羅福莉曾跳槽DeepSeek,參與研發(fā)了大模型“DeepSeek-V2”。一個(gè)員工都有這么大的魅力,DeepSeek創(chuàng)始人得有多強(qiáng)?就這樣,浙大天才,藏不住了。在一位不缺天才的時(shí)代,梁文鋒堪稱(chēng)天才中的奇才。他的想法很“超前”、行事低調(diào)神秘。他的資料多半靠媒體“拼圖”得來(lái)。有媒體說(shuō)他1985年出生在廣東五線(xiàn)城市,還是有媒體說(shuō)他1985年出生在廣東三線(xiàn)城市。他在17歲考上浙大前的經(jīng)歷,仿佛空白,到現(xiàn)在沒(méi)有一家媒體能說(shuō)清楚,更查不到證實(shí)過(guò)的公開(kāi)資料。三rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
2002年,梁文鋒考入浙大電子信息工程專(zhuān)業(yè)。在一個(gè)大模型聞所未聞的年代,“自學(xué)成才”的梁文鋒就已是一位“建模達(dá)人”。別的同學(xué)是研究主流就業(yè)方向,他只關(guān)注前沿科技。使得其在學(xué)校里“不太合群”。2007年,本科畢業(yè)的梁文鋒考入浙大信息與通信工程專(zhuān)業(yè)攻讀研究生,主修機(jī)器視覺(jué)研究。讀了一年,他就把書(shū)本知識(shí)琢磨透了,帶領(lǐng)同學(xué)校外實(shí)踐。“不太合群”的梁文鋒遇到志同道合的同學(xué),點(diǎn)燃了心中的熱情。他自己組建了一個(gè)AI實(shí)踐團(tuán)隊(duì),要把市場(chǎng)里的數(shù)據(jù)、知識(shí)研究透徹“理論結(jié)合實(shí)踐”。有傳言說(shuō),梁文鋒帶著同學(xué)跑各個(gè)行業(yè)交流時(shí),得到了大疆創(chuàng)始人汪滔的邀請(qǐng),“他欣賞,有實(shí)干精神的年輕人?!?/section>互聯(lián)網(wǎng)風(fēng)靡全球的階段,梁文鋒就堅(jiān)定的相信,“AI會(huì)改變世界”。他的“超前”意識(shí),不合群,連番交流中,有人嘲笑他“看科幻片看多了,AI會(huì)改變世界?太離譜了?!?010年,梁文鋒交出了一篇題為《基于低成本PTZ攝像機(jī)的目標(biāo)跟蹤算法研究》的碩士畢業(yè)論文。畢業(yè)后,他在科技行業(yè)找不到理想工作,決定拉著志同道合的校友創(chuàng)業(yè)。千萬(wàn)別以為,他馬上干大模型了,梁文鋒冷靜的出奇,知道時(shí)機(jī)不成熟,先琢磨掙出第一桶金。這里有個(gè)小插曲,梁文鋒除了是“建模達(dá)人”,也是學(xué)生中為數(shù)不多的“股神”,炒股賺過(guò)一筆財(cái)富。有了“炒股”積累,梁文鋒把AI知識(shí)與全自動(dòng)量化交易融合,創(chuàng)立了雅克比投資。2015年,中證500股指期貨上市,中國(guó)量化私募進(jìn)入2.0時(shí)代。量化基金擁有了量化工具,梁文鋒抓住機(jī)遇成立幻方科技,闖入陽(yáng)光私募大軍。后成立幻方量化,正式走上了量化交易之路。2016年,幻方量化推出第一個(gè)大模型,用GPU計(jì)算交易倉(cāng)位,年底管理基金規(guī)模約10億元。這亦是梁文鋒創(chuàng)業(yè)的獨(dú)特之處,“AI是個(gè)需要重金投入、燒錢(qián)未必能燒成功的賽道。梁文鋒的想法是,用知識(shí)切入吸金領(lǐng)域,別人不支持,就自己做資本,再投向未來(lái)事業(yè)。”這種在科技行業(yè)“自給自足”的創(chuàng)業(yè)創(chuàng)新能力,哪怕放到今天也很少見(jiàn)。四rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
“不求他人,不靠資本,就自己干,有錢(qián)了給新事業(yè)融資?!?/section>2023年,財(cái)富積累雄厚的梁文鋒,在杭州投資創(chuàng)立了深度求索,品牌DeepSeek。這也合理的解釋了DeepSeek于“大模型盛世”、“百模大戰(zhàn)”,在未有任何“頂流”資本加持,仍堅(jiān)強(qiáng)的活下來(lái),創(chuàng)投圈難以捕捉DeepSeek研發(fā)成長(zhǎng)軌跡的原因。“實(shí)現(xiàn)了自給自足式創(chuàng)業(yè)”。打破了科技創(chuàng)業(yè)者長(zhǎng)久以來(lái),“拿不到融資就很難走下去或資本倒逼過(guò)早商業(yè)化導(dǎo)致研發(fā)投入降低的底層邏輯?!彼焕⑹翘觳胖械钠娌牛灰罐Z動(dòng)硅谷?!安圾Q則已,一鳴驚人”。創(chuàng)立DeepSeek,是梁文鋒圓夢(mèng)AI的開(kāi)始。他想建設(shè)“一個(gè)效率奇高、由眾多前所未有的設(shè)計(jì)組合生成的超級(jí)工程?!?/strong>他要把中國(guó)人自己的AI、大模型做到全球第一,輻射全球。梁文鋒帶領(lǐng)DeepSeek團(tuán)隊(duì)的第一階段是,“降本增效”。“以最低的算力、最少的訓(xùn)練時(shí)間,重構(gòu)全球大模型生態(tài)?!?/strong>聽(tīng)上去挺瘋狂,OpenAI號(hào)稱(chēng)“全球最牛大模型公司”也沒(méi)做到,“DeepSeek-V3”做到了。據(jù)了解,DeepSeek搞出來(lái)一個(gè)新模式,達(dá)到了“降本增效”。所以,“美國(guó)科技創(chuàng)新大本營(yíng)”硅谷害怕了。根據(jù)Chatbot Arena最新數(shù)據(jù)顯示,“DeepSeek-V3”是全球性?xún)r(jià)比最高的大模型,開(kāi)源模型品類(lèi)排名全球第一,復(fù)雜問(wèn)題、代碼領(lǐng)域表現(xiàn)排名全球前三。更牛的一個(gè)突破是,“GPU需求變小”。什么意思?前文提到全球AI第一梯隊(duì)的頭部公司訓(xùn)練大模型至少要用到1.6萬(wàn)張以上GPU訓(xùn)練,換句話(huà)說(shuō),對(duì)GPU是愈發(fā)依賴(lài)。這也被視為全球大模型的發(fā)展障礙,要看GPU的臉色?!坝?xùn)練離不開(kāi)GPU”?!癉eepSeek-V3”牛在哪呢?用2048張GPU完成了1.6萬(wàn)張GPU干得事,一旦需求降低,GPU與大模型的主導(dǎo)關(guān)系會(huì)逐漸反轉(zhuǎn),對(duì)全球AI會(huì)是“驚天動(dòng)地”的變革,減弱GPU廠(chǎng)商的話(huà)語(yǔ)權(quán)。全球大模型,沒(méi)有公司做到這一步,DeepSeek走出的一小步,對(duì)未來(lái)AI格局影響深遠(yuǎn)。當(dāng)然,在波詭云譎的全球AI變局中,DeepSeek要做的事情會(huì)有很多。梁文鋒創(chuàng)業(yè)的一大優(yōu)勢(shì)是,“自給自足”,他和團(tuán)隊(duì)能騰出更多時(shí)間專(zhuān)注研發(fā)、錘煉技術(shù),推動(dòng)中國(guó)科技主導(dǎo)世界。最近,梁文鋒又火了。他參加了一場(chǎng)國(guó)家超高規(guī)格座談會(huì),并現(xiàn)場(chǎng)發(fā)言,科技行業(yè)沸騰了。雖然,梁文鋒的創(chuàng)業(yè)之旅有過(guò)“不被認(rèn)同”、“嘲笑”。但他并不孤單,越來(lái)越多的中國(guó)年輕人正積極投身科技事業(yè),發(fā)力飛行汽車(chē)、人形機(jī)器人等前沿賽道。踏破荊棘,勇往直前。送上一句梁文鋒接受媒體報(bào)道時(shí)的精彩回答,“中國(guó)的AI不可能永遠(yuǎn)跟隨,需要有人站到技術(shù)的前沿?!?/section>rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
rkW即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
本文鏈接:http://www.3ypm.com.cn/news-14-6848-0.html浙大天才,震驚全球
聲明:本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀(guān)點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇:金價(jià)攀升或非短期,多重利好年內(nèi)或?qū)ⅫS金推升至3000
下一篇:華力創(chuàng)科學(xué)完成數(shù)千萬(wàn)元A+輪融資,首創(chuàng)光學(xué)多模態(tài)感知技術(shù)獲金屬3D打印龍頭鉑力特青睞