首頁>數據>數字新基建
集中力量,促進國產AI大模型發展
——專訪十四屆全國政協委員、中科院計算所研究員張云泉
以OpenAI ChatGPT為代表的通用人工智能的快速發展,預示著全球新一輪科技革命和產業變革已經到來。ChatGPT除了有上萬塊GPGPU(通用圖形處理器)提供強大算力,還有大模型算法、大數據的支撐。
作為數字經濟時代的全新生產力,數據、算力和算法成為新時代的關鍵資源。大模型的開發、訓練、微調及推理各個環節均離不開算力,且算力成本占據整體開銷的大頭??梢哉f,算力成為支撐大模型發展的關鍵因素,也是科技競爭的戰略高地。
在大規模的前端產品落地后,算力建設能否及時跟上,成為AI大模型向各領域進一步滲透的關鍵因素。為此,本刊專訪了長期從事超級計算和算力經濟研究的十四屆全國政協委員、中國科學院計算技術研究所研究員張云泉,探討AI大模型發展如何打破算力瓶頸。
暴露核心問題
《瞭望東方周刊》:在大模型發展熱潮下,哪些問題成為制約國產大模型發展的重要因素?
張云泉:成本高昂、供應不穩,需求激增,這三點勾勒出了中國AI算力面臨的整體挑戰。
首先,大模型訓練用國產高端AI芯片供應不足,國產AI芯片公司尚未形成合力。目前,國內雖然已形成了以華為、寒武紀等為代表的優秀AI芯片廠商方陣,但由于缺乏算力芯片的國家或行業標準,各廠家形成了自己的生態體系且互不兼容,造成用戶學習和運營成本上升。目前,國內尚未有一家AI芯片公司的產品能夠支持萬卡并行大模型訓練,更不用說未來的十萬卡、百萬卡甚至千萬卡并行的挑戰。
其次,大模型落地所需要的配套軟件、服務生態及市場缺乏投資、引導與建設,所需要的低功耗芯片和算子庫的開發與應用、配套技術等不足。大模型產品形式單一,運營成本高,提高了傳統企業應用大模型的門檻、增加了研發費用和成本。
第三,目前,很多高校由于資源限制和師資力量不足,缺乏足夠的實驗設備和實踐機會,導致具有科技創新能力又能熟練應用AI新技術的人才十分緊缺。
6月22日,觀眾在天津2024世界智能產業博覽會上的天士力展臺了解數智本草大模型(李然/攝)
把握時間窗口
《瞭望東方周刊》:針對當前問題,國產大模型發展如何打破算力瓶頸?
張云泉:過去的15年,我國超算的研制水平已經達到世界領先水平,形成了神威、天河和曙光三大世界級超算研制團隊,奪得了11次世界冠軍和兩次超算應用最高獎戈登貝爾獎,神威新一代超算證明可以支撐萬億規模參數的大模型訓練過程。
因此,可以考慮設立能夠支持萬億級參數多模態大模型訓練的專用超算攻關專項,盡快緩解國產主權基礎大模型訓練的算力瓶頸。
國內一些企業往往傾向于使用國外的開源大模型,容易出現低水平重復與內卷,導致算力資源分散。時間窗口有限,我們不能錯失良機。
通過專用超算攻關專項計劃的支持,可充分利用超算領域多年積累的人才和技術優勢,快速形成突破,為研制更先進適用的大模型專用訓練芯片和系統贏得時間??梢钥紤]集中全國AI芯片研制力量,組建由業內權威專家和各主要AI芯片廠家參加的智能算力發展專項組,通過多輪競爭,確定訓練芯片研發技術路線和國家標準,集中投入,整合芯片產能,盡快研制出能夠滿足十萬卡、百萬卡甚至千萬卡并行算力需求的AI芯片和系統。
同時,要大力發展經濟實用大模型推理產業鏈。通過投資引導低功耗推理芯片和算子庫技術攻關,鼓勵大模型壓縮、適配和性能調優等技術研發,通過規模效應實現成本共擔,降低模型推理算力成本,形成經濟適用國產大模型推理產業鏈。此外,可為大模型企業和愿意通過大模型手段智能化轉型的傳統企業提供必要支持和配套服務,快速形成新質智能生產力,助力國產大模型平臺企業生態建設和占領市場。
《瞭望東方周刊》:針對人工智能人才培養的問題,您有哪些建議?
張云泉:針對教育資源分配不均,可以通過探索設立“生成式人工智能教學資源共享平臺”,以鼓勵學校間共享教學內容資源和教學計算資源。
課程內容更新方面,建議設立“生成式人工智能國際協同創新計劃”,以鼓勵國內外學校(或企業)合作創新課程內容和教學方法。
產教融合方面,學校和產業界應加強合作,可設立“生成式人工智能創新實踐基地”,以鼓勵有智能化需求的行業企業提供實習機會和人工智能應用場景。
師資力量方面,可加快推進在生成式人工智能領域企業導師的引進速度,通過企業導師幫助校內教師提升在生成式人工智能領域的知識和教學能力。
2023年5月23日,工作人員在貴州大學省部共建公共大數據國家重點實驗室的智能就業服務平臺上工作。該實驗室建成了一流科研平臺與超算中心,人工智能算力達120petaflops(劉續/攝)
“主權級”大模型
《瞭望東方周刊》:目前,國內企業之間山頭林立,從智能應用、開發框架、系統軟件、智能芯片,每層都有相關產品,但各層之間沒有深度適配,無法形成一個有競爭力的技術體系。這一問題應如何解決?
張云泉:AI大模型已成為各國科技競爭的戰略高地。要正面解決AI和算力領域發展面臨的各項困難和挑戰,找到一條發展主權級大模型的道路,非常重要。
從國際情況來看,2023年,英國創立“基礎模型工作組”,希望能擁有自己國家的“主權”人工智能技術,其公共服務也能夠從這種人工智能的轉型影響中受益。英偉達直接提出“主權AI”的概念,并將其定義為“一個國家利用自己的基礎設施、數據、勞動力和商業網絡生產AI的能力”。
“主權AI ”涵蓋物理和數據基礎設施,后者就包括“主權級基礎大模型”——由當地團隊開發,并在當地數據集上進行訓練,以促進對特定語言、文化和習俗的包容性。
“主權級基礎大模型”其實是一個動態概念,指的是某一時期內最高水平的大模型。這一大模型算力要求最高、智能水平最高,是一個國家AI水平的最高點、基礎大模型的基礎,也可以被稱為“根模型”。
對中國來說,要立足國產算力平臺和智能芯片,推動實現利用自己的基礎設施、數據、勞動力和商業網絡發展AI的能力;要將發展“主權級大模型”和算力實體產業培育發展新質生產力相結合,正面解決中國AI和算力領域發展面臨的關鍵問題。
編輯:馬嘉悅