“我整個職業(yè)生涯一直在做這個東西,但心里很清楚,同行也這么認為——在我們有生之年,‘蛋白質(zhì)的折疊’問題是不可能解決的,尤其是蛋白質(zhì)結(jié)構(gòu)預測問題。結(jié)果AlphaFold出來了!” 10月9日,博士生導師、國際著名計算生物學家、復旦大學復雜體系多尺度研究院院長馬劍鵬教授告訴澎湃科技。
當?shù)貢r間10月9日,瑞典皇家科學院宣布,將2024年諾貝爾化學獎授予三位科學家,其中,一半授予美國華盛頓大學的戴維·貝克 (David Baker),以表彰其在計算蛋白質(zhì)設(shè)計方面的貢獻,另一半則共同授予英國倫敦人工智能公司谷歌DeepMind公司的丹米斯·哈薩比斯(Demis Hassabis)和約翰·喬普(John M. Jumper),以表彰其在蛋白質(zhì)結(jié)構(gòu)預測方面的貢獻。
這是繼10月8日兩位人工智能先驅(qū)被授予2024年諾貝爾物理學獎之后,人工智能科學家們再次被授予諾貝爾獎。
2021年,復旦大學復雜體系多尺度研究院院長馬劍鵬團隊合作發(fā)表基于主鏈的蛋白質(zhì)側(cè)鏈預測算法(OPUS-Rota4 算法),針對谷歌團隊AlphaFold的軟肋,大大提升了蛋白質(zhì)側(cè)鏈結(jié)構(gòu)測試精度。
據(jù)介紹,上述預測算法“目前已經(jīng)迭代至OPUS-Rota6,精度比AlphaFold 2/3都高”。
對于2024年諾貝爾化學獎,馬劍鵬認為,雖然人們疑惑又有人工智能領(lǐng)域的科學家拿諾獎,但這其實分兩個問題:一是蛋白質(zhì)結(jié)構(gòu)的預測,該不該拿諾獎;二是人工智能在這方面的貢獻值不值得拿諾獎。
“這也是為什么給他們這個獎。其實這個問題并沒有完全解決,但已經(jīng)往前進了一大步,已經(jīng)超越了我們有生之年的期望?,F(xiàn)在已經(jīng)可以使用了?!瘪R劍鵬說。
他認為,正如復旦大學宣布將推出至少100門AI領(lǐng)域課程一樣,AI已繞不開,你不一定需要會寫算法,但至少要會用。他建議,“從娃娃抓起”,會用AI。
復旦大學復雜體系多尺度研究院院長馬劍鵬教授。
他還強調(diào),為什么谷歌Deepmind公司能取得AlphaFold這樣的突破?這個問題對中國極具現(xiàn)實意義。
“王冠上的明珠”:一個老得不得了的極難的科學問題
蛋白質(zhì)為什么重要?
“在你身體的每個細胞內(nèi),數(shù)十億個微型機器——蛋白質(zhì)——正在努力工作。”
有人甚至說,幾乎生命的一切特征都跟蛋白質(zhì)有關(guān)。
的確,蛋白質(zhì)是每個生物體中每個生物過程的基礎(chǔ),它是生命的基石。沒有蛋白質(zhì),生命就無法存在。結(jié)構(gòu)是如此重要,蛋白質(zhì)復雜而多樣的結(jié)構(gòu),對應了各種驚人的功能,從而促成了生命的豐富多彩。其結(jié)構(gòu)背后是生命的奧秘。
“我給學生上課,頭一件事就是要解釋為什么蛋白質(zhì)的結(jié)構(gòu)預測如此困難、如此復雜?”馬劍鵬說。
一個個氨基酸相連“串成”多肽,而長鏈一樣的多肽折疊形成穩(wěn)定的空間三維結(jié)構(gòu),成為一個有功能的蛋白質(zhì)。根據(jù)一個氨基酸序列推測出相應蛋白質(zhì)最終的“折疊結(jié)構(gòu)”(folded structure),這就是蛋白質(zhì)結(jié)構(gòu)的預測問題。它被視為現(xiàn)代分子生物學“皇冠上的明珠”。
馬劍鵬說,“這不是個新問題。而是個老得不得了的問題,然而這個問題是如此的難?!?span style="display:none">WdP即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
他舉例,100個氨基酸組成的蛋白質(zhì)非常小,但假如其中的每個氨基酸只有兩個態(tài)——折疊態(tài)和非折疊態(tài)(但實際上它有無窮個態(tài)),那么這個蛋白質(zhì)就有2的100次方個態(tài)。
“這個數(shù)字是如此巨大,如果用人類的任何計算機一個一個窮舉過來,或者來檢索,尋找其中一個正確答案,需要的時間甚至比宇宙壽命還長。但是蛋白質(zhì)瞬間就能完成折疊?!瘪R劍鵬說。
科學家通過X射線晶體學或冷凍電鏡等實驗技術(shù)來測定蛋白質(zhì)結(jié)構(gòu),但耗時費力。
劍橋大學的研究人員約翰·肯德魯和馬克斯·佩魯茨在20世紀90年代末取得了突破性的發(fā)現(xiàn),他們成功地使用了一種叫做x射線晶體學的方法,展示了第一個蛋白質(zhì)的三維模型。為了表彰這一發(fā)現(xiàn),他們于1962年被授予諾貝爾化學獎。
“2020年,AlphaFold解決了50多年來最大的科學挑戰(zhàn)之一?!盌eepmind官網(wǎng)稱,“取得了蛋白質(zhì)結(jié)構(gòu)預測方面的根本性突破”。
到目前為止,AlphaFold已經(jīng)預測了超過2億種蛋白質(zhì)的結(jié)構(gòu)——幾乎所有科學界已知的蛋白質(zhì),并幫助科學家了解生命分子如何相互作用。
AlphaFold 軟件已發(fā)布過三個主要版本。2018年12月,一個使用 AlphaFold 1的研究小組在第13屆結(jié)構(gòu)預測關(guān)鍵評估(CASP13) 的總體排名中名列第一。2020 年11月,一個使用AlphaFold 2的團隊在CASP14競賽中再次名列第一。
2021年7月15日,關(guān)于AlphaFold 2的研究論文在國際學術(shù)期刊《自然》(Nature)上在線發(fā)表,論文標題是《使用 AlphaFold 進行高精度蛋白質(zhì)結(jié)構(gòu)預測》(Highly accurate protein structure prediction with AlphaFold)。John Jumper和Demis Hassabis是共同通訊作者。
AlphaFold 3于2024年5月8日發(fā)布。它可以預測蛋白質(zhì)與DNA、RNA、各種配體和離子形成的復合物的結(jié)構(gòu)。相關(guān)研究論文也于同一天在線發(fā)表在國際學術(shù)期刊《自然》(Nature)上。
Deepmind官網(wǎng)介紹,迄今為止,全球數(shù)百萬研究人員已使用 AlphaFold 2在瘧疾疫苗、癌癥治療和酶設(shè)計等領(lǐng)域取得發(fā)現(xiàn)。AlphaFold 3讓人們超越蛋白質(zhì),進入更廣泛的生物分子領(lǐng)域。這一飛躍可以開啟更多變革性科學,從開發(fā)生物可再生材料和更具彈性的作物,到加速藥物設(shè)計和基因組學研究。
馬劍鵬說,“如果純粹從蛋白質(zhì)結(jié)構(gòu)的建模上,或者說制藥業(yè)的藥物設(shè)計上來看,Alphafold的精度(準確度)遠遠沒有達到理想的精度。但是,它比以前的工具不知道好到哪去了!”
結(jié)構(gòu)預測是技術(shù),設(shè)計是藝術(shù)
馬劍鵬介紹,蛋白質(zhì)的結(jié)構(gòu)預測問題實際上涉及兩個具體問題——蛋白質(zhì)折疊的過程和最終的結(jié)構(gòu)預測?!耙粋€是蛋白質(zhì)到底是怎么折疊起來的?其實就是剛才那一百個氨基酸的多肽折疊起來的整個過程。在起點和終點之間,怎么走?這個問題到現(xiàn)在也沒有解決。但是從生物學家的角度,他們可以繞開第一個問題,我不care(在乎)到底是怎么折疊的,給你一個蛋白質(zhì)序列,你只要能告訴我最終的蛋白質(zhì)結(jié)構(gòu)就行了。根本不看路徑。實際上路徑(問題)更煩。”
與預測結(jié)構(gòu)相比,馬劍鵬表示,設(shè)計一個新蛋白更難。前者是解題,預測一個自然界已經(jīng)存在的蛋白的結(jié)構(gòu),后者是創(chuàng)造一個不曾存在的結(jié)構(gòu)?!八?,我一直說搞折疊是個技術(shù),搞設(shè)計是個藝術(shù)?!?span style="display:none">WdP即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
2024年的三位諾貝爾化學獎得主之一戴維·貝克(David Baker) 在加州大學伯克利分校師從蘭迪·謝克曼獲得生物化學博士學位,并在加州大學舊金山分校師從大衛(wèi)·阿加德進行生物物理學博士后研究。他現(xiàn)在是華盛頓大學生物化學教授、華盛頓大學醫(yī)學院蛋白質(zhì)設(shè)計研究所所長。貝克實驗室開發(fā)蛋白質(zhì)設(shè)計軟件,并利用它來創(chuàng)建分子,以解決醫(yī)學、技術(shù)和可持續(xù)性方面的挑戰(zhàn)。他最近的工作之一是開發(fā)用于生成功能性蛋白質(zhì)的強大機器學習方法。
貝克還是華盛頓大學基因組科學、生物工程、化學工程、計算機科學和物理學的兼職教授。他發(fā)表了600多篇研究論文,共同創(chuàng)辦了21家公司,并獲得了100多項專利。
馬劍鵬介紹,貝克做蛋白質(zhì)結(jié)構(gòu)預測更早,在AlphaFold出現(xiàn)以前,他多次是CASP比賽的冠軍。他預測的準確率達到了百分之四十幾?!柏惪送怀龅膬?yōu)點就是,他不僅會計算,會預測,他還會做實驗,做設(shè)計。他本身是做實驗出身,他的團隊是一個非常典型的“干濕”結(jié)合的團隊,所以特別成功。”
上世紀90年代末,戴維·貝克開始開發(fā)能夠預測蛋白質(zhì)結(jié)構(gòu)的計算機軟件羅塞塔(Rosetta)。研究小組繪制了一種具有全新結(jié)構(gòu)的蛋白質(zhì),然后讓羅塞塔計算:哪一種氨基酸序列可以產(chǎn)生所需的蛋白質(zhì)。事實證明,羅塞塔確實可以構(gòu)建蛋白質(zhì)。研究人員開發(fā)的蛋白質(zhì)Top7幾乎跟他們設(shè)計的結(jié)構(gòu)完全相同。
顯而易見,人們可以用這種軟件設(shè)計想要的蛋白質(zhì),用作藥物、疫苗、納米材料和微型傳感器。
人生無處不AI:已繞不開,宜從娃娃抓起,不能再不懂
“我有一個觀點,我認為,Alphafold的成功,對AI領(lǐng)域、計算機科學領(lǐng)域的影響,可能比對蛋白質(zhì)結(jié)構(gòu)預測的影響更重要。”馬劍鵬。
這種觀點源自他長期的觀察:1997年,“深藍”計算機(Deep Blue)曾經(jīng)打敗過國際象棋的世界冠軍加里·卡斯帕羅夫(Garry Kasparov)。當時就有人覺得天要塌下來了,世界要被電腦顛覆了,結(jié)果什么事情都沒發(fā)生;人們認為國際象棋的棋盤那么小,可以被打敗,但圍棋是不可能被電腦打敗的。2016年3月,阿爾法狗(AlphaGo,阿爾法圍棋)以4:1比分戰(zhàn)勝韓國圍棋九段高手、世界冠軍李世石。又有人覺得天要塌了。但也有人認為,那只是個游戲,圍棋游戲而已。直到Deepmind公司不惜代價,把AlphaFold做出來。
“計算機科學AI領(lǐng)域的人一看,連這么難的蛋白質(zhì)結(jié)構(gòu)預測都能做出來,人臉識別、自動駕駛還算事兒嗎?結(jié)果真的變成‘人生無處不AI了’?!薄半m然Alphafold不完美,但真的可以用了,它可以加速科研?!瘪R劍鵬說,Alphafold的成功催生了一個現(xiàn)在天天能聽到的名詞——AI for science,用AI這個工具輔助科學研究。
復旦大學2024年招生培養(yǎng)政策發(fā)布會上發(fā)布的信息稱,從2024年秋季學期開始,復旦大學將在2024-2025學年推出至少100門AI領(lǐng)域課程。AI大課將納入所有復旦學生的學業(yè)安排。“要從娃娃抓起,你不能再不懂AI,不能再不會用AI?!?“不需要每個人天天專門做算法,但廣大科技工作者哪怕是做實驗的,也至少得會用?!瘪R劍鵬說,AI算法確實非常強大,Alphafold已經(jīng)真正有實用價值了,不像以前搞理論自娛自樂。Alphafold這種技術(shù)的存在,使得包括顏寧、施一公等科學家在內(nèi)的做實驗的人,他們解析蛋白質(zhì)結(jié)構(gòu)的速度可能更快了,但不是說不用做實驗了?!八€取代不了實驗。至少到今天為止,‘金標準’還得靠實驗。如果哪一天預測技術(shù)準確到,算出來的結(jié)構(gòu)一定是對的,那世界又變了?!?span style="display:none">WdP即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
為什么谷歌Deepmind公司能取得AlphaFold這樣的突破?是因為算力嗎?
馬劍鵬說,“這個問題對我們國家,尤其現(xiàn)在,是非常有意義的?!?span style="display:none">WdP即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
他表示,首先算力很重要,但關(guān)鍵還是算法。其次是問題的選擇——你有沒有想法,瞄準蛋白質(zhì)結(jié)構(gòu)預測問題。
馬劍鵬說,“更重要的一個啟示是,你有沒有注意到現(xiàn)在大部分突破都是公司做出來的?”
他表示,它是典型的“大兵團作戰(zhàn)”。公司和高校的區(qū)別在于,在高校里面,你再有經(jīng)費,還是單一的一個團隊。但在公司里,可以雇各種各樣的人,在一個領(lǐng)頭人的負責下,為了同一件事努力。“(公司里)不需要你發(fā)nature或發(fā)science等論文。你的任務就是把這個事情做出來。這是一種范式上的轉(zhuǎn)變。團隊作戰(zhàn),最大的特點就是一定要有一個強有力的‘領(lǐng)頭羊’,把各種各樣的人團結(jié)在一起。理論上,這很適合于我們國家,我們也有這樣的經(jīng)驗,集中力量辦大事?!?span style="display:none">WdP即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
(原標題:諾獎解讀|馬劍鵬:AI已繞不開,不能再不懂,宜從娃娃抓起)
本文鏈接:http://www.3ypm.com.cn/news-8-9272-0.html復旦教授馬劍鵬:AI已繞不開,宜從娃娃抓起
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕