首 頁 資訊 產業動態 發明·創新 探索·發現 科學麻辣燙 科技人物 專家講壇 新基建 院士知播

首頁>科技>資訊

李國杰院士:國內AI研究如何擺脫困境

2021年08月09日 09:19  |  來源:中國科學報
分享到: 

2016年DeepMind公司的人工智能程序AlphaGo戰勝了人類圍棋冠軍,曾引起全世界的轟動。

2020年11月30日,DeepMind公司的另一個人工智能程序AlphaFold 2在蛋白質結構預測大賽CASP 14中,對大部分蛋白質結構的預測與真實結構只差一個原子的寬度,達到了人類利用冷凍電子顯微鏡等復雜儀器觀察預測的水平,這是蛋白質結構預測史無前例的巨大進步。這一重大成果雖然沒有引起媒體和廣大民眾的關注,但生物領域的科學家反應強烈。

中國科學院院士施一公對媒體說:“依我之見,這是人工智能(AI)對科學領域最大的一次貢獻,也是人類在21世紀取得的最重要的科學突破之一,是人類在認識自然界的科學探索征程中一個非常了不起的歷史性成就。”

蛋白質是生命的基礎,了解蛋白質的折疊結構和分子動力學是生物學界最棘手的問題之一,已經困擾科學家50年之久。

目前已知氨基酸順序的蛋白質分子有1.8億個,但三維結構信息被徹底看清的還不到0.1%。最近DeepMind公司在《自然》上宣布已將人類的98.5%的蛋白質預測了一遍,計劃今年年底將預測數量增加到1.3億個,達到人類已知蛋白質總數的一半,并且公開了AlphaFold 2的源代碼,免費開源有關數據集,供全世界科研人員使用。

被釋放的海量蛋白質結構信息蘊含著生命信息的密碼,將有力推動生命科學的發展,大大加速針對癌癥、病毒的抗生素、靶向藥和新效率的蛋白酶的研發。

在AlphaFold 2 問世以前,許多科學家做過用計算機預測蛋白質三維折疊結構的研究。中科院計算技術研究所的卜東波團隊去年在《自然》發表論文,他們在蛋白質結構預測方面做出了出色的成果。

DeepMind團隊采用的注意力機制也是計算機視覺和自然語言處理領域較成熟的技術。最近華盛頓大學推出預測準確度與AlphaFold 2差不多的新算法,只需要一個GPU,10分鐘左右就能算出蛋白質結構。

蛋白質折疊問題的解決是生物學界和人工智能界長期合作努力的結果,但AlphaFold 2的“臨門一腳”是取得勝利的標志性突破,它用精確的預測結果顯示出人工智能技術在基礎科學研究上的巨大威力。AlphaFold 2的巨大成功給我們許多耐人尋味的啟示。

2017年國務院印發《新一代人工智能發展規劃》后,我國立即啟動了“新一代人工智能重大科技項目”,開展數據智能、跨媒體感知、群體智能、類腦智能、量子智能計算等基礎理論研究,統籌布局了人工智能創新平臺和許多關鍵共性技術研究。

近三年,我國學者發表了大量人工智能論文,申請幾萬件專利,在北京冬奧會、城市大腦等應用場景和抗擊新冠疫情中取得顯著成效,出現了一些人工智能獨角獸企業,取得的成績可圈可點。但總的來講,我們的研究多數是技術驅動、論文導向的,目標導向和問題導向的研究較少。

AlphaFold 2的成功首先是因為10年前DeepMind團隊就開始關注“蛋白質折疊”這個有重大價值的科學問題。幾年前用計算機預測復雜的蛋白質折疊結構,正確率還不到40%,DeepMind團隊當時就有信心攻克這個世界難題。

我們與一流科學家的差距之一是選擇可突破的重大科學問題的眼光不夠敏銳,布局的科研項目要么是增量式的技術改進,要么是幾十年都難以突破的理想型目標,像蛋白質折疊這樣的重要研究方向沒有列入新一代人工智能重大科技項目。

人工智能研究可能取得重大突破的目標不只是蛋白質折疊,我認為,用機器學習的方法全自動地做集成電路的前端和后端設計也有可能在十年左右取得突破,如果做到了,讓人焦心的集成電路設計人員缺口巨大的難題就會迎刃而解。這一類涉及經濟發展的重大問題應該是人工智能界關注的焦點。

為什么重大科學問題和國計民生問題沒有進入人工智能界許多學者的視野,這涉及對人工智能這門學科的認識。

最先提出“人工智能”這個術語的麥卡錫對這門學科的定義是:“人工智能就是要讓機器的行為看起來就像是人所表現出的智能行為一樣。”后來的人工智能學者大多盯住了“像人”這個“原則”,以“像不像人”作為目標。所謂衡量智能水平的“圖靈測試”也是遵循這個原則。授予沙特阿拉伯公民身份的“索菲婭”和清華大學的“華智冰”機器人,都是朝著“像人”這個目標努力。

但硅基的計算機和碳基的人腦終究有本質性的區別,非要把電子線路構成的機器做成與人一樣,既沒有必要也沒有可能。

現在用于機器學習的人工神經網絡與人的大腦有相似的地方,但也體現出與人的思維不同的機器“思維”方式。理性的人工智能發展模式應該承認人有人智、機有機“智”,要充分發揮機器“思維”的特長,做人不擅長做的事情。

AlphaFold 在蛋白質結構預測上體現出的才能不是“像人”,而是比人高明。人工智能是對人類的補充和增強,而非替代人類,我們并不需要復制人的智能,而是要建立一個新的智能系統。人工智能研究擺脫“模仿人”“替代人”的思想束縛后,會有更廣闊的發展空間。

AlphaFold的成功表明,疑難問題的解決不一定完全依賴于人類的先驗知識,這意味著在人工智能時代,人類獲取知識的邏輯將發生根本性變革,對人類認知將產生巨大沖擊。

機器學習是一種全新的、人類也無法真正理解、但能被實踐檢驗的認知方法論。我們是相信“實踐是檢驗真理的標準”,人機互補構建命運共同體,還是堅持機器必須給人講明白演繹和歸納過程才是真理,人類將面臨新的選擇。

機器學習可以正確預測蛋白質結構,說明機器已掌握了一些人類還不明白的“暗知識”。過去我們把可以表達的知識叫作“明知識”或“顯知識”,不可表達但可以感受的知識叫作“潛知識”或“默知識”。現在又多出了一類既不可表達又不可感受但機器能明白的知識,可稱為“暗知識”。知識維度的增加大大擴充了人類的視野。如果說“明知識”是冰山顯露出來的一角,“潛知識”是冰山海面下的部分,“暗知識”就如同大海。對人類而言,如何利用“暗知識”可能比弄明白“暗物質”“暗能量”更重要、更緊迫。

蛋白質結構預測取得重大突破的另一個啟示是,科研范式已經開始轉向。

AlphaFold團隊是一個典型的跨學科合作團隊,在《自然》發表此重大成果的論文作者有34位,其中19位并列第一作者,包括機器學習、語音和計算機視覺、自然語言處理、分子動力學、生命科學、高能物理、量子化學等領域的知名學者。蛋白質形成穩定折疊結構的原因是分子內部的勢能會降到最低點,預測計算實際上是能量最小化的優化。

深度學習的人工神經網絡在計算機視覺、自然語言處理和生物信息學等領域表現優異,不僅僅源于算法和數學,背后還有深層次的物理原理。因此,理論物理學家的介入十分重要。基于最基礎科學原理的機器學習需要人類多領域科學家的智慧和機器“智能”有機融合,不同于以發現相關性為主要目標的科研第四范式——數據密集型科學發現,我認為這是科研第五范式的雛形。

AlphaFold并沒有提出新的科學原理,而是研究已知原理的相互組合涌現出的大量新奇結構、特性和行為,把對結構的認知抽象成各種模式的自動化識別和匹配,本質上是一種集成式的工程科學技術。

過去生物學家只是把人工智能當成眾多的輔助工具之一,AlphaFold的成功改變了生物學家的看法。工程科學技術不只是工具,也不僅僅是基礎研究成果的應用,而是在基礎研究中可以發揮巨大作用的重要組成部分。沒有像DeepMind團隊一樣強大的工程技術實現能力,基礎研究也難以做出重大成果。

目前我國大學和企業的人工智能實驗室大多遇到頂天頂不了、立地又落不下去的困境 ,希望人工智能界的學者認真總結經驗教訓,在研究方向選擇上多費點心思,爭取獲得讓人眼睛一亮的重大成果。

(作者系中國工程院院士)


編輯:魯雅靜

關鍵詞:蛋白質 結構 人類 預測


人民政協報客戶端下載 >

相關新聞

久草日韩精品暖暖的在线视频,精品国产综合色在线,极品少妇粉嫩小泬精品视频,青青热久免费精品视频在线播放
亚洲午夜理论片在线观看 | 亚洲成a人网站在线看 | 天天摸天天碰天天添中文 | 亚洲精品一级在线播放 | 五码三级级精品国产宾馆 | 久久99久久99精品免费观看 |