2025年,具身智能機器人迎來關鍵技術突破與產(chǎn)業(yè)落地的關鍵節(jié)點。 這份由浙商證券產(chǎn)業(yè)研究院發(fā)布的《2025年具身機器人行業(yè)未來展望報告》,深入剖析了當前人形機器人“大腦”架構、核心技術路線、主流廠商大模型進展以及未來智能化分級趨勢,揭示了行業(yè)從L3邁向L4乃至L5的清晰路徑。 報告首先從人腦結構出發(fā),類比提出機器人“大腦”的演化方向:當前多數(shù)人形機器人所謂的“大腦”實際上承擔的是小腦功能,即運動控制與動作協(xié)調,而真正具備高級認知、語義理解與決策能力的“大腦”尚處雛形。 未來發(fā)展方向將是大小腦分離——小腦專注實時動作控制,大腦則搭載更強算力平臺實現(xiàn)復雜任務理解與規(guī)劃。 在硬件層面,英偉達憑借Jetson Orin系列及最新發(fā)布的Jetson Thor計算平臺,已成為高算力機器人“大腦”的主導者。 Thor芯片基于Blackwell架構,AI算力高達800TOPS,專為運行GR00T等大型生成式AI模型設計,已在波士頓動力Atlas機器人上落地應用,標志著邊緣端大模型與機器人深度融合的新階段。 算法層面,行業(yè)呈現(xiàn)“分層決策”與“端到端”兩大技術路線。 Figure AI采用分層架構,由大語言模型負責理解,小模型負責執(zhí)行;而Google RT-2則走端到端路線,一個模型完成從感知到動作的全流程。 訓練方式上,模仿學習依賴人類示范數(shù)據(jù),強化學習則通過環(huán)境交互自主探索。 數(shù)據(jù)采集則面臨“仿真到現(xiàn)實”(Sim2Real)與真實世界采集的權衡,前者成本低但存在域偏移,后者真實但效率低下。 值得關注的是,2025年多家企業(yè)發(fā)布重磅大模型:銀河通用推出千億級抓取模型GraspVLA,實現(xiàn)零樣本泛化;Figure AI發(fā)布VLA通用模型,融合70億參數(shù)VLM與快速反應策略;智元機器人推出ViLLA架構的GO-1模型,通過隱式動作建模顯著提升任務成功率;英偉達發(fā)布GR00T N1,采用雙系統(tǒng)VLA架構,并構建“數(shù)據(jù)金字塔”整合互聯(lián)網(wǎng)視頻、合成數(shù)據(jù)與真實機器人數(shù)據(jù),破解數(shù)據(jù)稀缺難題。 展望未來,報告引用小鵬汽車何小鵬的觀點,將機器人智能化劃分為L1-L5五個等級。 當前行業(yè)正邁向L3(具身智能與訓練監(jiān)督),預計2026年實現(xiàn)初階商業(yè)化。 L4(自成長智能)預計3-5年內落地,以B端工業(yè)和服務場景為主;L5(完全自主智能)則需5-10年,核心能力將從“理解世界做任務”轉向“理解人性做伴侶”,進入家庭生活場景,互聯(lián)網(wǎng)大廠或將憑借數(shù)據(jù)優(yōu)勢主導C端生態(tài)。 值得注意的是,遙操作正成為通往高階智能的必經(jīng)之路。 特斯拉、智元等企業(yè)通過VR+動捕服進行大規(guī)模技能采集,智元更建成百臺機器人數(shù)據(jù)工廠,日均采集數(shù)萬條真實數(shù)據(jù)。 未來,遙操作不僅用于訓練,還可能催生“遠程雇員平臺”等新型商業(yè)模式,提前實現(xiàn)機器人商業(yè)化價值閉環(huán)。 出品方:浙商證券 發(fā)布時間:2025年 文檔頁數(shù):33頁 |