首 頁 資訊 產業動態 發明·創新 探索·發現 科學麻辣燙 科技人物 專家講壇 新基建 院士知播

首頁>科技>資訊

全國政協委員、天娛數科CEO賀晗:3D數據是人形機器人發展關鍵資源

2024年12月11日 10:22  |  作者:王菡娟  |  來源:人民政協網 分享到: 

人民政協網12月11日電(記者 王菡娟)作為未來產業的前沿領域,人形機器人已成為全球科技和產業競爭的新賽道。近期,隨著特斯拉、OpenAI、英偉達等科技巨頭的加碼布局,人形機器人賽道迎來空前熱度。從市場空間看,據GGII預測,2030年全球市場規模將突破200億美元,中國市場規模將達到50億美元左右。特斯拉CEO埃隆·馬斯克展望,長期來看人形機器人需求量可能達100億臺!

那么,如何看待本輪的人形機器人熱?人形機器人會有怎樣的發展階段?記者采訪了全國政協委員、天娛數科CEO賀晗。

人形機器人發展分三個發展階段

當下人形機器人產業火熱,提及背后的原因,賀晗表示,火熱的背后是技術跨越帶來的產業變革浪潮。

“今年以來,大模型技術與機器人技術加速融合、進化,使人形機器人成為具身智能的關鍵載體,為人形機器人帶來了革命性的變革,讓門檻大幅降低、場景快速增多,催生了‘研發熱’‘應用熱’‘投資熱’。”賀晗說。

賀晗還介紹了人形機器人的三個發展階段。

1. 0階段:基于程序控制的演示階段。人形機器人脫胎于工業機器人,加上擬人化的外形,目的在日常生活中進行應用,依賴于程序控制。這些程序通常是由工程師根據特定的任務和場景進行編寫,機器人按照指令完成簡單的動作演示。這個階段的人形機器人功能比較單一,只能完成一些預先設定的任務,主要應用于科技館、展覽會等場所,作為展示科技成果的工具。

2. 0階段:基于大模型的模仿階段。模仿學習技術讓人形機器人通過觀察和模仿人類的行為,直接從人類的示范中學習動作和技能,快速掌握一些復雜的操作,如穿衣、做飯、打掃衛生等日常生活動作,以及特定領域的專業技能,如工業生產中的零件裝配、醫療護理中的簡單操作等。結合虛擬仿真平臺技術,將模仿學習的數據在仿真環境進行海量泛化訓練,可以更好地提高泛化能力和適應性。與此同時,視覺-語言-動作(VLA)模型的發展讓人形機器人能夠更高效地完成從視覺、語言理解到推理并生成動作的全過程,將自然語言指令轉化為具體行動規劃,并具備一定泛化能力,使人形機器人成為具身智能關鍵載體,這是革命性的。

3. 0階段:基于海量3D數據的智能階段。這是今后的發展方向,從被動響應和執行到主動感知和決策,是這個階段的標志。核心是海量3D數據的喂養,讓具身智能構建世界模型,這是真正意義上的具身智能大模型,它能創建對世界運作方式的內部表征,并具備行動后果的推理能力,從而顯著提升對真實世界的感知、推理、執行與預測能力,使機器人認識和理解3D世界,并能夠像人類一樣進行推理和規劃,不僅可以適應復雜多變的環境和任務需求,更為重要的是,具備自主決策、行動與操作能力。

“同時,隨著多智能體協同技術的引入,未來,這一方向可能發展出更加高級的群體智能算法和多智能體系統,使得具身智能體能夠協同完成復雜任務。例如,在家庭陪伴場景中,機器人能夠利用3D空間數據理解家庭成員的行為,并通過世界模型進行因果推理。如當檢測到老人在客廳摔倒時,能夠迅速判斷位置并主動聯系急救人員,同時采取初步的急救措施。當具身智能可以高度智能化地執行與人類相同的任務,則代表我們真正邁入了通用智能時代。”賀晗說。

3D數據人形機器人發展的關鍵資源

在賀晗看來,要實現人形機器人發展3D數據是關鍵資源。

“3D數據對于提供真實人物、場景的展示、豐富的交互和決策支持至關重要,3D數據能讓AI對物理世界人與物的形態、結構、位置、動作有更準確的理解,可以在三維場景中像人類一樣對視覺信息進行高級推理,超越二維視覺的局限。具身智能大模型極端依賴大規模、高質量的3D數據訓練。當下高質量3D數據集匱乏是產業痛點,全球范圍內,3D數據都處于極端重要,又極端缺乏的狀態。3D數據集正在成為競爭的核心節點。”賀晗說。

2023年10月,谷歌DeepMind聯合全球33家頂級學術實驗室共同開發Open X-Embodiment數據集,基于該數據集訓練了RT-X系列3D多模態大模型用于人形機器人。2024年3月,斯坦福大學、伯克利大學聯合全美多家頭部研究機構推出DROID 分布式機器人交互數據集,涵蓋3D軌跡、3D場景等。2024年3月,全球著名人工智能專家李飛飛教授領銜、聯合美國多所大學推出BEHAVIOR-1K具身智能數據平臺,涵蓋了50個場景、9000多個具有豐富物理和語義屬性的物體。

3D數據集,在可見的未來,決定3D多模態大模型和空間智能的發展,以及全球科技競爭的走勢。

但賀晗也坦言,3D數據集的發展有兩個痛點,一是3D數據的獲取與處理成本高昂、流程繁雜,需要大量的時間、人力與資金投入;二是3D數據的標準化程度低,導致數據的兼容性較差,共享和復用難度大。

為此,天娛數科在這方面也進行了一系列布局。

據賀晗介紹,為了解決第一個問題,天娛數科去年與合肥產投一起戰略投資了芯明。芯明是一家專注空間計算及人工智能芯片及產品設計的高科技企業,其自研空間計算芯片是目前全球唯一單芯片集成芯片化實時3D立體視覺感知、AI、SLAM(實時定位圖)的空間智能系統級芯片,采用12nm制程工藝,具備3.5TOPS的端側算力,功耗僅為約0.5W,可支持單芯片接入6路傳感器,其產品解決方案已在全球范圍內應用在泛機器人、XR、消費電子、物流無人機、3D掃描等多個前沿應用領域的龍頭企業產品中,真正實現了“感算一體、多路融合、空間智能”的功能。與芯明合作后,依托其芯片和模組優勢,通過多種高精度3D 掃描設備,采集 3D 場景、模型、動作等多類數據源,大幅降低了3D數據采集成本。

“為了解決第二個問題,我們融合大模型、3D數據集、可視算法,構建了空間智能MaaS平臺,通過跨類型數據的智能解析提高數據標準化程度和易用性。目前模型與多項算法已完成中央網信辦生成式人工智能服務備案。平臺目前擁有超80萬組3D數據、35萬組多模態數據。”賀晗說。

今年10月份,天娛數科采集加工形成的“人形機器人空間動捕長程數據”“大場景空間感知模型重建數據”等5個3D具身智能數據集正式在北京國際大數據交易所完成數據資產登記,通過數據信息的核驗、合規審查、登記備案等環節,成為全國首個完成資產登記的3D具身智能數據集。

“未來,天娛數科將在模型訓練、數據集拓展、平臺性能優化等方面持續努力,不斷深化AI+3D技術競爭優勢。”賀晗說。

標準、人才、平臺建設一個不能少

賀晗同時還對中國人形機器人產業發展提出了三點建議。

一是加快標準制定與完善,包括硬件接口標準、軟件通信協議標準、3D數據集標準、性能標準等,確保不同企業的產品之間能夠實現更好的兼容性和互操作性,同時大力推動標準國際化。二是加強復合型人才培養,目前人形機器人領域懂機械、自動化、程序控制的很多,懂大模型、具身智能的很少,兩者都懂得少之又少,建議在高校中設置具身智能相關專業或方向,加強多學科交叉融合,增加實踐教學環節,培養學生的跨學科思維和實際動手能力。三是鼓勵通用平臺建設,建立從硬件到軟件、從底層到應用層、從模型底座到3D數據集的多層次具身智能通用平臺架構,鼓勵企業、高校和科研機構等各方在平臺上進行技術研發、應用創新和資源共享,形成良好的產業協同創新氛圍,降低創業門檻,避免重復“造輪子”,加速具身智能技術的推廣應用和產業化進程。

編輯:馬嘉悅

久草日韩精品暖暖的在线视频,精品国产综合色在线,极品少妇粉嫩小泬精品视频,青青热久免费精品视频在线播放
先锋资源国产区一区二 | 亚洲va韩国va欧美va久久 | 图片区国产激情一区二区三区 | 伊人久久大香线蕉综合AⅤ 综合激情久久综合激情 | 亚洲精品第一国产综合境外资源 | 先锋资源视频在线资源 |