2026年具身智能产业发展研究报告(附下载)
作者:iedumedia 浏览:2013次 发布于:2026-03-09
在政策、技术、市场共同推动下,中国具身智能产业进入快速发展期。2025 年行业融资活跃,前 11 个月融资额达 334.73 亿元,为 2024 年同期 4 倍,全年融资超 305 起、总额超 380 亿元,吸引超 600 家投资机构参与。人口老龄化、劳动力短缺及传统自动化不足,催生了对具身智能的强烈需求。以人形机器人为代表的具身智能加速成熟,形成完整技术闭环并迈向量产,产业从技术研发进入生态构建与价值兑现关键阶段。本文将围绕具身智能的定义、驱动力、现状、资本、产业链、重点企业及未来趋势展开梳理分析。

当前,在政策引领、技术突破与市场需求的共振驱动下,中国具身智能产业正迈入快速发展的新阶段。在此背景下,资本市场布局也日益活跃。公开资料数据显示,2025年前11个月具身智能产业融资额达到334.73亿元,是2024年同期的4倍;截至2025年12月21日,全年融资事件超305起,总额超过380亿元,参与的投资机构数量超过600家。资本的密集涌入,充分印证了产业发展的潜力与市场信心。这种信心,根植于社会经济发展中持续涌现的明确而迫切的替代需求。随着人口老龄化加剧与劳动力结构性短缺等问题持续凸显,社会对能够替代人工、承担高风险任务并提升产线效率的智能化解决方案需求日益迫切。传统自动化设备受限于固定场景与预设程序,难以适应柔性制造、人机协作等动态复杂环境,产业升级面临核心瓶颈。为突破这一局限,以人形机器人为代表的具身智能正在加速演进,逐步形成具备高阶认知能力的“感知-认知-决策-执行”完整技术闭环,并逐步走向规模化量产,以更好地适应多样化场景需求。由此,具身智能产业的发展主线已从技术攻关延伸至生态构建与商业闭环,标志着产业正式进入价值兑现的关键阶段。

本文将对具身智能定义、发展驱动力、发展现状、资本动态、产业链、部分重点企业、中国具身智能产业未来趋势等进行梳理,以供参考。


定义



具身智能(Embodied  Artificial  Intelligence, EAI) 尚未形成完全统一的标准定义 ,但主流范式指向非常明确 ,即强调智能体通过物理实体与环境交互来实现自主学习和进化。其核心在于将感知、认知与行动深度融合 ,使机器在“感知-理解-行动”的闭环中持续迭代 ,逐步形成涌现智能。

 具身智能可以搭载多种形态的载体 ,如智能机器人、 自动驾驶汽车、 自主航行器等 ,本文聚焦于机器人方向的具身智能 ,按照形态划分为人形机器人和非人形机器人两大类。

中国具身智能产业呈现多技术路线并行发展的格局。人形机器人因其形态与人类生活场景和工作空间的高度适配 ,被认为是具身智能的长期理想形态,但受限于运动控制、灵巧手等核心技术瓶颈及成本效率问题 ,短期内尚未实现全场景替代和广范围普及;非人形机器人的应用场景边界和能力天花板相对明确 ,受益于技术链条成熟度高且成本相对可控 ,率先在巡检、仓储、安防等垂直场景中实现规模化应用 ,是当前具身智能形成规模化普及的主要载体形式。本报告重点关注具身智能的技术演进、生态布局及应用实践。


1.png
发展驱动力



(一)具身智能的加速演进 ,得益于国家层面的前瞻部署和地方层面的协同推进

中国具身智能领域的相关政策体系已经形成由“国家顶层设计引领、部委专项政策支持、地方创新实践落地”的多层次、系统性推进格局。2025年具身智能首次被写入《政府工作报告》 ,标志其正式进入国家战略性视野。在“十五五 ”规划建议中 ,具身智能被纳入未来产业体系 ,被视为培育新质生产力、塑造未来竞争新优势的关键引擎之一。在此框架下 ,工信部、科技部、发改委等主管部门相继出台了一系列专项规划与行动方案 ,从技术攻关、产业生态、应用示范等维度构建起支撑产业发展的纵向政策支柱。与此同时,北京、上海、深圳、合肥等城市密集出台具身智能有关专项政策 ,并以产业园区为抓手 ,搭建专业化服务平台 ,力争破解技术落地、场景开放、产业链协同等产业发展中的共性难题 ,形成横向协同、特色突出的地方实践网络。


2.png


(二)软硬件协同优化是机器人突破非结构化场景的核心路径,也是达成高级自主智能的关键基础

从技术侧看 ,具身智能产业发展依托大模型、多模态融合与仿真训练等基础技术的系统性突破 ,推动机器人进入更加开放、动态的复杂物理环境。

大模型为具身智能提供通用认知与任务规划能力 。 随着视觉-语言-动作(VLA)大模型不断演进 ,机器人从被动执行预设指令 ,升级为能够理解自然语言、拆解复杂任务并自主规划路径的智能体 ,任务泛化能力和跨场景迁移效率显著提升 ,成为具身智能进入真实场景的核心认知引擎。

多模态融合与局部运动控制技术的进步大幅提升具身智能在真实环境中的稳定性和鲁棒性。在感知层面 ,视觉、语言与本体感觉的多模态闭环融合 ,强化了机器人的场景理解与人机交互能力;在执行层面 ,行走、平衡与抗扰等局部运动控制技术的突破 ,提升了机器人在动态环境中的稳定性、安全性和鲁棒性 ,为其在商场、人群密集区等非结构化场景的落地部署提供技术支撑。

仿真与硬件协同推动系统迭代。仿真与硬件协同推动系统迭代。基于仿真平台、世界模型与数据工厂构建的高质量、大规模训练数据集 ,加速了端到端模型训练与验证。 同时 ,高能量密度电机、仿生关节、轻量化材料及高性能传感器等关键硬件的持续突破 ,为人形、多足、轮式等不同形态的机器人提供了高性能、低功耗的协同硬件底座 ,支撑其实现更复杂、更持久的实体作业能力。


3.png


(三)从人力替代到服务补位与效率升级,具身智能迎来结构性增长窗口

从需求侧看 ,具身智能产业发展主要受生产力结构性短缺、公共服务长期存在缺口等社会现实因素驱动。这些结构性挑战共同促使社会与产业寻找能够替代部分人工、提升产出效率并承担高风险任务的智能化解决方案。

劳动力结构性短缺与成本上升催生替代需求。 随着人口老龄化与劳动力供给变化 ,制造、服务、农业等领域的人力成本持续上涨、招工矛盾加剧 ,促使企业寻求自动化与智能化替代方案。具身智能凭借环境感知和自主作业等能力 ,能够在较为复杂和非标准化的场景中执行重复性、高负荷或流程化任务,实现连续作业 ,降低人工依赖度。

养老护理等公共服务体系面临长期的供需缺口。根据国际护士理事会数据,预计到2030年全球护士缺口将达到1300万人 ,这直接推动家庭养老机器人与陪护机器人在基础护理、认知陪伴与健康监测等场景加速落地。此外 ,在火灾救援、地震排查、核辐射作业、深海与深空开发等高危场景中 ,具身智能可替代人类进入高风险环境执行任务 ,显著降低人员作业风险。

现在产业链对高效率、低损耗的连续作业需求不断提高。传统自动化设备无法覆盖非结构化、多任务动态场景 ,如多品类柔性制造、农业采摘等。具身智能通过感知、决策与执行能力形成闭环 ,可在多变环境中自主完成复杂操作 ,减少人工环节、提升生产或服务效率 ,并实现7 ×24小时连续投入。例如 ,波士顿咨询的研究显示 ,激光除草机器人可减少约80%除草剂使用量。


4.png
发展现状



具身智能产业加速迈向规模化发展新阶段 ,开启商业化浪潮

综合技术成熟度、产业链完备度和市场拓展速度来看, 中国具身智能产业处于全球第一梯队。以人形机器人为例, 国内领军企业已完成从原型开发到规模化量产的工程验证。例如, 2025年12月 ,智元机器人宣布第5000台通用具身机器人量产下线交付 ,印证了中国在工程化、交付能力和生产组织方面的实质性进展。根据国家发改委以及智源研究院统计数据, 中国具身智能企业数量已超过230家 ,其中人形机器人企业超过150家。

在产业链配套方面, 中国正在形成覆盖关键零部件的自主可控能力 ,并具备明显成本优势和本地配套能力。根据《金融时报》2025年4月的统计, 中国拥有25家机器人手部零部件供应商(美国仅7家) ,拥有30家腿部线性执行器供应商(美国仅6家) ,供应链纵深和效应效率明显优于海外 ,美国银行分析认为中国智能机器人的整机成本可控制至海外同类产品的50%左右。此外, 国产大模型迭代加速 ,银河通用等头部企业通过自研VLA大模型 ,摆脱对第三方模型的依赖 ,显著提升了机器人在非结构化环境中的调度效率。

在市场层面, 中国具身智能展现出高度的成长弹性 ,成为全球增长最快的具身智能市场之一。根据36氪研究院测算 ,具身智能市场规模已从2018年的2,133亿元增长至2025年的9,150亿元 ,并有望于2026年突破万亿元关口。


5.png
资本动态



具身智能成为资本竞逐赛道 ,工程可实现性和商业落地潜力成重要投资标准

当前 ,具身智能是资本市场最受关注的战略性赛道之一 ,产业融资规模呈现爆发式增长。根据东方财富网和IT桔子数据, 2025年前11个月具身智能产业融资额达到334.73亿元 ,是2024年同期的4倍; 截至12月21日 ,全年融资事件超305起 ,总额超过380亿元 ,参与的投资机构数量超过600家 ,融资规模上涨显著 ,亿元级大额融资逐渐成为主流。

从资本构成看 ,具身智能领域的投资呈现出以产业资本( CVC)为核心、各类资金功能清晰、协同推进的布局特征。一方面 ,百度、 阿里、美团、京东等科技与互联网巨头通过CVC力量在“大脑 ”算法、本体以及关键场景层面展开系统性卡位;另一方面 ,上汽集团、歌尔股份、龙旗科技等传统企业依托其产业背景与供应链能力 ,以CVC形式推动具身智能在工业制造、物流等环节的工程化与量产落地。与此同时 ,以银河通用、智元机器人等为代表的头部创业公司 ,也开始积极利用资本工具构建生态协同和加速自身发展。例如 ,智元机器人通过反向收购上市公司上纬新材 ,成功开辟了非传统的二级市场融资路径 ,为其技术研发与规模化落地提供资本支撑。

总体来看 ,具身智能赛道已进入产业化攻坚与价值兑现的关键时期。


6.png
产业链



(一)产业图谱

具身智能产业依托上游核心技术,在中游形成产品与解决方案,在下游场景中实现价值落地

具身智能产业链上游为软硬件开发企业 ,是整个产业链的技术基石 主要涵盖核心硬件组件与软件算法体系两大板块 ,技术壁垒最高 ,其发展程度直接决定具身智能产品的性能水平与成本结构。其中 ,核心硬件组件是具身智能产品的物理基础 ,包括芯片、传感器、控制器、伺服电机、通信模组、能源管理等核心零部件。软件算法体系则为具身智能产品赋予智能核心 ,主要包括AI大模型、运动控制算法、感知融合算法、操作系统、云边端协同平台等核心技术方向。

中游为具身智能产品制造企业 ,承担产品规模化职责 ,是连接上游技术与下游应用的传导中枢。根据不同产品形态 ,可以将具身智能产品分为人形机器人和非人形具身智能产品两大类。这主要由于人形机器人的设计旨在模仿人类的形态与能力 ,以便更好地融入为人类设计的环境和工作流程 ,被业界视为一种高级通用形态。非人形具身智能产品(如机械臂、协作机器人、轮式机器人、 自动驾驶汽车等)通常为特定任务设定 ,在具体场景上追求功能与效率的最优解。当下 ,全球产业界和资本市场正在竞相布局人形机器人 ,并将其看作是推动人工智能在实体经济落地的战略性方向。人形机器人的技术研发和商业应用正在全面提速 ,业界普遍认为 ,2025年是人形机器人的量产元年 ,也是商业化落地的元年。 随着供应链成熟和技术突破, 目前人形机器人的单机成本已经从百万元级降至几十万元 ,正以百台、千台级别的量产向大规模量产的标准不断接近。

下游为应用领域 ,是具身智能产业链的价值变现终端, 已经形成多元化的细分应用场景。其中 ,工业制造领域发展最为成熟 ,商用服务领域处于快速增长阶段 ,特种服务领域具备高增长潜力 ,交通出行领域则处于商业化破局期,各场景的梯度化发展为产业链提供了持续增长的动力。


7.jpg


(二)上游发展新动向

1. 得益于AI大模型与多模态融合驱动,具身智能的智能化水平不断提升

以大语言模型( LLM)和多模态感知技术为核心的AI能力 ,正成为驱动具身智能上游发展的关键力量 ,推动其从传统的“感知-执行 ”模式, 向具备高阶认知能力的“感知-认知-决策-执行”完整闭环演进。

以GPT系列等为代表的通用多模态大模型 ,以及Helix、GROOT等专为机器人设计的专用模型 ,是具身智能的核心认知中枢 ,它们通过在海量数据上获得的先验知识 ,赋予具身智能产品强大的语义理解、任务逻辑拆解与跨场景泛化决策能力。例如, Figure公司的Helix模型仅需数百小时的训练 ,便能指挥多台机器人协作完成冰箱物品收纳 ,展现出对未知物体的零样本泛化能力。此外 ,视觉、触觉、 听觉等多模态感知技术的深度集成 ,为具身智能构建了高精度的环境理解能力。多模态融合增强了其在非结构化场景中的感知鲁棒性 ,也为复杂物理交互奠定了基础。例如 ,特斯拉Optimus Gen2实现手拿鸡蛋等精细操作 ,即依赖于视觉定位与力控反馈的协同机制。

目前 ,上游技术路径呈现出从专用小模型向“通用大模型+垂直场景微调 ”方向演进的趋势 ,然而也带来了模型规模庞大、计算需求高企的新挑战。 因此 ,如何通过模型压缩、蒸馏、剪枝等技术实现大模型的高效轻量化 ,并使其能够在算力与功耗受限的边缘侧设备中稳定、实时地运行 ,成为推动技术大规模落地与成本控制的关键瓶颈。


8.png
2. 具身智能的硬件标准化与运动控制系统仍存在瓶颈,软硬件协同有待进一步突破


运动控制系统是实现具身智能肢体驱动、姿态平衡及多维度运动规划的关键系统 ,需融合控制器、伺服驱动器、传感器等硬件与强化学习、动力学模型预测等算法 ,技术壁垒高且产业化难度大。

上游硬件生态的标准化缺失与运动控制技术的成熟度不足 ,共同构成了制约具身智能产品高效集成的核心技术瓶颈。一方面 ,在硬件层面 ,传感器、一体化关节、控制器等核心部件在机械接口、 电气规范和通信协议上缺乏统一标准 ,导致供应链呈现碎片化状态。整机厂商不得不针对不同供应商的组件进行定制化适配 ,这不仅大幅延长了研发周期 ,也使得系统集成成本居高不下 ,严重阻碍了产品的快速迭代与规模化生产。另一方面 ,体现在运动控制算法与物理硬件的深度融合上。机器人高动态的运动性能 ,如全身协调平衡、复杂地形步态生成、柔顺力控交互等 ,不仅依赖于先进的算法 ,更取决于算法与高精度伺服电机、力矩传感器、减速器等底层执行单元之间的精准建模与协同优化。 目前 ,这一软硬结合的环节仍存在大量工程难题 ,算法仿真与真实物理系统之间存在模拟到现实的鸿沟 ,导致机器人的实际运动表现、稳定性和可靠性难以达到理论预期。为突破这一瓶颈 ,行业正从硬件标准化和软件生态化两个方向积极推动 ,以求构建开放协同的产业生态 ,实现从技术研发到稳定量产的高效转化。


9.png


(三)中游发展新动向

1. 人形机器人

(1)人形机器人本体分为大脑、小脑、肢体三部分,成本集中于执行器和传感器等核心零部件

从技术角度来看 ,人形机器人本体可分为大脑、小脑和肢体三部分 ,分别对应决策交互模块、运动控制模块和执行模块。


10.png


从成本构成来看 ,根据特斯拉Optimus  Gen2、 Figure  02及国内厂商披露数据 ,一台功能完备的人形机器人(约20-40自由度)成本结构如下。其中,执行器和传感器合计占比60%以上 ,是国产替代的主战场。


11.png


(2)人形机器人核心部件国产化分化明显,中低端成熟,部分高端仍依赖进口且性能存在差距

人形机器人核心部件的国产化程度分化明显。结构件已实现近全国产化, 电池、控制器等部件国产化率较高且技术成熟 ,但力传感器、丝杠等高端部件的国产化率偏低 ,对进口依赖程度较高 ,是当前产业降本与实现供应链自主可控的主要瓶颈。具体而言 ,谐波减速器的国产化率已经超过50% ,但是寿命和精度与国外同类产品相比仍有差距。行星滚柱丝杠国内加工的良率仅为60% ,低于海外85%以上的水平 ,直接限制了线性关节的规模化量产。无框力矩电机的功率密度已达到海外产品的80% ,但温升控制能力有待提升。空心杯电机受绕线工艺制约, 国产产品扭矩波动率超过10% ,显著高于海外产品不足5%的标准。六维力传感器精度为±2% ,低于海外产品±0.5%的精度要求 ,且其标定周期长达3个月 ,是海外产品的3倍; 电子皮肤的柔性电路良率仅30% ,暂未具备商业化量产条件。


12.png


(3)灵巧手正向着高自由度和高感知能力方向发展,以持续提升通用作业能力与环境适配性

灵巧手是人形机器人末端执行器的核心零部件。机器人末端执行器作为整机开展作业的核心执行部件 ,主要涵盖夹持器、抓持手、灵巧手等形态 ,各类形态均有其专属适配场景 ,通常安装于机器人腕部末端。传统机器人末端执行器多采用夹爪形式 ,在操作灵活性、动作精准度等方面存在局限 ,而灵巧手采用类人手的结构设计 ,具备高自由度、高精度的技术特点 ,可与人形机器人配套协作完成各类复杂作业任务 ,如小型物体抓握、物品搬运等 ,在工业场景、商业场景、家用场景中均有较大的应用潜力。

灵巧手由驱动、传动、感知三大模块组成。驱动模块是灵巧手的动力核心,为各关节的灵活运动提供稳定动力输出 ,直接决定其动作响应速度与负载能力;传动模块是动力传递的关键枢纽 ,实现驱动模块动力向各执行关节的精准传导 ,保障手部动作的平稳性与协调性;感知模块是灵巧手的感知反馈核心 ,通过各类传感器采集位置、力度、接触等关键信息 ,为其精准操作、环境适配与安全作业提供数据支撑。当前 ,灵巧手的技术路线并未收敛 ,但整体趋势朝着更高灵巧性以及更强感知能力的方向发展 ,使其通用作业能力与环境适应性持续提升。例如 ,银河通用推出灵巧手神经动力学模型DexNDM,通过分布有偏的真实数据训练 ,无需成功示例 ,即可精准弥合Sim2Real鸿沟,让通用灵巧手能够对多类物体实现稳定、多姿态、多轴向的旋转操作。


13.png


(4)人形机器人行业市场参与者众多,多以机器人本体研发为主

人形机器人行业正处于快速发展阶段, 国内外市场参与者日趋活跃。 国外方面 ,特斯拉的擎天柱机器人和FigureAI是代表性企业。 国内方面 ,银河通用、宇树科技、智元机器人、云深处、优必选等公司 ,估值均已过百亿 ,构成行业领先阵营。此外 ,星动纪元、松延动力、数字华夏、逐际动力、众擎、小鹏机器人等企业也具备较高知名度。从资本动向来看 ,人形机器人领域已经成为投资焦点。根据公开资料的不完全统计 ,2025年中国机器人领域的融资规模中 ,人形机器赛道融资金额占比约36% ,总融资金额超过百亿元 ,多笔单笔过亿元的融资诞生于此 ,显示出资本市场对该赛道的高度关注。


14.png
15.png


当前, 国内公司仍以机器人本体研发为主 ,多集中在硬件层面。 国内创业者多为硬件工程师背景 ,竞争焦点多集中在动作的流畅性、灵活性、步态仿生、手部操作等方面。相比之下 ,专注于人工智能技术研发的企业尚未大规模进入该领域。大型科技企业目前多数保持观望态度 ,预计可能在市场成熟后加速进入。此外 ,头部新能源汽车企业也是一类潜在玩家 ,其布局逻辑与马斯克研发机器人相似。它们具备可迁移的自动驾驶感知与决策技术、 明确的工厂落地场景 ,以及通过机器人实现降本增效的规模化需求。

(5)人形机器人进入规模化放量的关键阶段,产品价格持续下探,十万台级量产规模可期

在2025年量产元年的基础上, 2026年人形机器人产业正迈入规模化放量的关键阶段。据高工机器人产业研究所数据 ,2025年国内人形机器人出货量达1.8万台, 同比增超650%, 2026年有望提升至6.25万台。业内专家更为乐观 ,预估2026年国内产量将达10万-20万台级 ,头部企业的交付规模将实现阶梯式的跃升*。

人形机器人加速放量的背后, 除了技术迭代 ,成本下行是直接驱动因素。例如 ,优必选Walker系列机器人2025年成本较2024年下降25%;宇树科技推出的“ UnitreeR1智能伙伴 ” ,身高123厘米以内、体重约29千克 ,起售价仅2.99万元 ,大幅降低了大众消费门槛;松延动力也于2025年10月推出小尺寸机型Bumi小布米 ,身高约94厘米、体重12千克 ,预售价格不足万元*。

人形机器人的应用普及是一个渐进式过程 ,要达成规模化应用 ,需要在三大智能方向上实现突破。一是运动智能 ,聚焦下肢能力 ,确保机器人在复杂环境中全身协同、 自主导航、抗干扰 ,实现稳定运行。二是精细操作 ,聚焦上肢能力 ,强调脑眼手三者协作 ,运用VLA大模型解决轨迹规划与多样化行为生成问题 ,实现精细操作。三是学习智能 ,聚焦认知进化 ,使机器人能够理解世界 ,进行预测、规划并评估解决方案 ,具备持续学习与进化的能力。


16.png


(6)人形机器人的商业化节奏日趋加快,工业领域成为商业化扩张的关键一步

在规模化量产推进的同时 ,人形机器人的商业化订单落地节奏也在同步加快。部分企业已经开始收获千台级别的商业化订单或明确意向 ,带来潜在的现金流。例如 ,银河通用在2025年12月与百达精工达成合作 ,计划在百达精工及其生态体系内部署超过1000台具身智能机器人。众擎机器人也在同期透露,仅巡逻巡检等场景的意向订单已超过3000台。此外 ,数字华夏在商务应用场景接到的意向订单超过1500台 ,主要分布在金融、教育、运营商等多个场景。

目前 ,人形机器人的商业化探索主要集中于三大核心场景 :工业巡检与物流、商业服务与导览、家庭陪伴与护理。其中 ,教育、安防、演出等多元场景已经在2025年完成初步尝试。进入2026年 ,行业普遍认为 ,人形机器人进入工厂环境、参与实际生产作业 ,将成为其商业化扩张的关键一步。这主要是由于工业场景任务明确 ,环境相对规范 ,企业对降本增效需求迫切 ,使得人形机器人的商业应用价值更易于被验证和量化。但需要理性认识的是, 目前人形机器人尚未构成生产力核心。业界认为, 2026年到2028年 ,人形机器人将迎来应用落地潮 ,逐步渗透至泛工业与商业服务领域。家庭场景正在被验证 ,但距离真正融入生活里还有较大鸿沟。伴随商业化推进 ,预计2030年人形机器人市场规模将达到254.04亿元 ,比2025年增长十倍以上。


17.png


(7)人形机器人需借助世界模型来突破空间智能瓶颈,进而实现更高维度的智能

人形机器人的硬件成本持续下行已经是一个明确趋势 ,但是产业发展的核心突破口在于机器人大脑的演进 ,尤其是李飞飞教授提出的世界模型(也称为空间大模型) 的技术突破。与二维场景下的自动驾驶相比 ,机器人运行于三维空间 ,动作复杂度指数级提升 ,仅依赖预编程动作难以满足实际应用需求,必须依托空间大模型的支撑。当前主流大模型虽在语言领域实现显著突破,

但是缺乏理解三维世界、操控物体、预测物理现象的空间智能 ,这正是制约人形机器人向高阶发展的根本瓶颈。 因而 ,这也使得空间智能被认为是AI大模型下一个十年的核心前沿技术。

业界认为 ,下一阶段的大模型需要具备空间感知与推理能力。例如 ,当一只猫跳上放有杯子的桌子时 ,大模型应该能像人一样预判杯子可能被打碎。只有当空间大模型走向成熟 ,人形机器人才能实现更高维度的智能 ,胜任叠衣服、炒菜等需要环境交互的任务 ,并通过持续迭代承担更多类人工作。

在空间智能这个新兴领域中 ,李飞飞教授将世界模型定义为具备以下三项核心能力的系统: 1)生成性。世界模型能够生成具有感知、几何与物理一致性的世界; 2)多模态。世界模型在设计上就是多模态的; 3)交互性。世界模型能根据输入动作输出下一个状态。


18.png


2. 非人形具身智能产品

从自动执行迈入自主决策,在工业和商用领域实现更深度的渗透与更复杂的价值创造

非人形具身智能产品的核心类别包括 :工业机器人(AGV/AMR移动机器人、协作机器人、机械臂等) ;服务机器人(清洁机器人、外骨骼机器人、陪伴机器人等);自动驾驶载具(自动驾驶汽车、eVTOL、 民用无人机等)。

工业机器人: AI自主化与IT/OT融合成为核心发展方向。一方面 ,生成式AI让机器人得以在复杂环境中自主调整参数, 自主决策能力不断提升。另一方面 ,融合化趋势明显, IT与OT深度融合构建的数字孪生系统 ,实现物理与数字世界无缝对接 ,单台机器人可替代多台传统专用设备 ,显著提升装配效率。例如 ,在特斯拉上海超级工厂的质检车间, 300台工业相机以每秒200帧的速度扫描车身焊缝 ,AI大模型在0.3秒内完成1280项缺陷检测。并且 ,AI已经学会自我进化 ,大模型每周自动更新3次 ,每次迭代效率提升0.5%*。

服务机器人:场景细分与轻量化、实用化突破。服务机器人已逐渐迈入实用化落地阶段 ,聚焦家庭、户外、养老等细分场景的产品持续涌现。 2026年CES展会上 ,多款创新产品亮相 ,如追觅科技全球首款仿生六足履带式爬楼扫地机器人、黑芝麻智能双轮足户外陪伴机器人、傲鲨智能增程动力外骨骼机器人等 ,覆盖清洁、陪伴、养老等核心需求。其中 ,智能穿戴类微型具身智能产品正在形成千亿级消费市场 ,相关联动App月活用户突破千万量级。

自动驾驶载具:技术进阶与监管规范化并行。搭载端侧大模型的智能座舱实现从语音交互到情绪陪伴的进阶,“车-家-城 ”无缝互联生态不断成熟 ,可联动智能家居实现场景闭环。特斯拉、小米等企业推动智驾算法与具身智能技术底层打通 ,分体式飞行汽车等跨界产品逐步走向量产。 民用无人机的监管规范化引发行业洗牌 ,标准统一倒逼企业技术改造 ,合规能力成为市场准入核心门槛 ,行业从一家独大向多元竞争、精准细分转型。

(四)下游发展新动向

具身智能应用持续向工业领域、服务领域、特种领域、交通出行领域等下游场景渗透

1. 工业领域:柔性制造成为核心竞争力 ,生态协同加速落地

在工业领域,具身智能的应用已超越传统预编程自动化, 向柔性制造、 自主决策和产业生态协同方向发展。在工件分拣、装配与质检等核心生产场景中,自主移动机器人(AMR)、 自适应机械臂、复合机器人等产品已成为智能工厂的核心组成部分。这类装备融合高精度3D视觉、力觉感知及深度学习技术,可精准执行小批量、多品种的复杂作业任务 ,突破了传统工业机器人的固定工位限制。例如 ,银河通用重载机器人Galbot S1已实现零遥操全自主运行,成功应用于宁德时代等制造业巨头的工业产线。

在产业端,头部企业从单一产品供应转向开放生态构建。例如 ,智元机器人发布开源仿真平台Genie Sim 3.0 ;北京人形机器人创新中心与福田康明斯、中国电科院等跨行业企业合作开发垂直场景解决方案 ,加速技术落地进程。

从市场应用分布来看 ,汽车制造、 电子电气和金属加工是具身智能在工业领域三大主要应用场景。据统计 ,2024年汽车及零部件为最大应用领域, 占比43.3%;消费类电子产品和金属及机械加工分别占比19.1%和10.3%。


19.png


2. 服务领域:场景多元化拓展 ,情感交互与体验升级成突破口

具身智能在服务领域基本实现场景全覆盖 ,从商业服务到家庭陪伴 ,从公共服务到情感交互 ,形成多元化落地格局。并具有三大共性特点:一是场景细分精准化 ,二是交互体验拟人化 ,三是产品形态轻量化与创新化。

在商业场景中 ,服务机器人已实现标准化作业落地。例如 ,智元精灵G2在 CES 2026现场演示酒店侍应生服务 ,可精准完成饮料递送等交互任务。元鼎智能构建了从泳池清洁、水质管理及庭院灌溉的智能庭院全场景解决方案,引领庭院生态迈向“认知智能”的新阶段。数字华夏的机器人“夏起” 已经在头部银行承担大堂经理的角色 ,负责迎宾导览、业务讲解、业务咨询等工作。银河通用以Galbot人形机器人为核心,“银河太空舱”智能零售解决方案已在全国数十核心商圈与地标常态化运行 ,智慧药房解决方案实现24小时值守运营。擎朗智能通过“通用 +专用 ”协作的机器人产品矩阵, 已全面融入酒店运营 ,覆盖前厅迎宾、客房清洁、送餐送物、行李配送等多元场景。日常生活场景中 ,情感陪伴成为新增长点 ,傅利叶“Care-bot”GR-3人形机器人通过视觉识别与拟人化动作反馈 ,实现人机井字棋对弈等情感交互;可以科技推出的桌面AI伙伴Desk Mate ,通过“仿生角色AI系统 ”实现主动理解式自然交互 ,开辟办公陪伴新赛道。公共服务领域, 医疗服务机器人在医院承担消毒、送药、患者转运等工作 ,缓解医护人员工作压力。


20.png


3. 特种领域:极端环境适配能力提升 ,任务闭环化作业成主流

特种领域是具身智能发挥替代人类进入危险环境的核心价值的关键场景 ,近两年在极端环境适配与任务执行能力上实现明显突破。在灾害救援与安防领域 ,浙江温州巡特警大队启用的球形机器人具备水陆两栖能力 ,滚动速度可达35公里/小时 ,可用于抗洪救援、化工厂巡查等高危场景 ,并能适应复杂地形的高速移动。在能源领域, 防爆巡检机器人已实现规模化应用, 中国石油北斗运营服务中心采用轮式防爆机器人与挂轨机器人组成立体巡检网 ,可以在-40℃至70℃极大温差环境、强电磁干扰、油污泥泞等极端条件下稳定运行 ,通过热成像与气体监测实现隐患秒级识别。此外 ,特种机器人还在核电维护、太空探索等领域持续突破 ,耐受高强度辐射的核电机器人、月球基地建设用太空机器人已进入工程验证阶段。

4. 交通出行领域:将迈向系统协同与立体生态

在交通出行领域 ,具身智能的应用已超越单一交通工具的自动化 ,正推动整个移动系统向协同化、立体化与自治化演进。其发展聚焦于自动驾驶、智能补能及低空出行三大方向。

自动驾驶车辆作为核心移动智能体 ,其感知与决策能力持续进化 ,部分企业通过端到端的大模型技术 ,将视觉信号直接映射为控制指令 ,以应对更复杂的开放道路场景。在智能补能场景 ,道通科技的智能充电机器人实现与自动驾驶车队的组网协同 ,通过“云端消息流 +机械臂动作闭环 +车队队列控制 ”机制, 自动完成充电枪插拔、收回与车队调度 ,为大规模自动驾驶车队补能奠定基础。与此同时, 出行疆域正从平面向立体拓展。领先企业正进行多维布局 ,将地面自动驾驶( Robotaxi) 、人形机器人(用于车辆维护、客户服务等)与飞行汽车整合 ,试图构建一个多元融合的未来出行生态。例如 ,银河通用推出跨本体全域环视的导航基座大模型NavFoM ,可低成本适配机器狗、轮式人形、腿式人形、无人机、甚至汽车等不同尺寸的异构本体。这一趋势预示着城市交通网络将向“地下-地面-低空”多层级融合演进。


部分重点企业



(一)银河通用

银河通用成立于2023年5月 ,是市场领先的具身多模态大模型通用机器人企业。 自创立之初 ,银河通用便确立了“合成数据驱动+多模态大模型 ”的核心技术路径 ,致力于通过算法与硬件的高度协同 ,让机器人走进千家万户、服务千行百业。截至目前 ,银河通用累计融资金额已超过8亿美元 ,投资方包括国家与地方政府投资平台、产业资本和VC/PE机构等。

当前 ,银河通用已推出轮式双臂机器人Galbot  G1和Galbot  S1 ,并陆续发布了GraspVLA、 GroceryVLA、 NavFoM等多个自研端到端具身大模型 ,在功能上相互补位。针对具身智能领域长期存在的数据稀缺与泛化能力不足两大瓶颈 ,公司开创性提出一套“虚实结合、以合成为主、真实为辅”的数据训练范式 ,成功构建百亿级数据集 ,实现了Sim-to-Real的高效迁移。整体来看 ,银河通用的核心竞争力在于构建了一个从百亿数据集、到具身大模型、再到机器人本体的全栈自研体系 ,并开创了“大规模仿真合成数据预训练 +少量真实数据后训练”的虚实融合具身VLA新范式。

银河通用具身智能机器人已在工业制造、即时零售仓、智慧城市服务、 医疗康养等场景规模落地。在工业制造领域 ,公司已与宁德时代、博世集团、丰田汽车、韩国现代、北汽集团、上汽集团、极氪汽车等国内外龙头企业达成深度合作 ,率先实现人形机器人进厂真实自主干活 ,累计订单规模达数千台;在智慧城市服务领域 ,公司开创城市级具身智能解决方案“银河太空舱”,

以人形机器人Galbot为核心 ,实现完全自主的运营与值守 ,打造人与机器人“零距离”交互的智慧零售与城市服务终端;在即时零售仓储领域 ,2024年底 ,公司与爱博医疗联合推出24小时智慧医疗门店, 引入银河通用人形机器人实现全自主运营 ,实现具身智能即时零售的可复制、可推广的规模化解决方案。在医疗康养领域 ,公司与宣武医院等三甲医院开展深度合作 ,推动人形机器人在病房辅助、药房管理与智慧导诊等场景落地。

(二)元鼎智能

元鼎智能Aiper专注于庭院智能产品的研发及全球品牌拓展 ,产品包括泳池机器人及其他庭院智能产品 ,是无线智能泳池机器人的品类开创者。公司全球化布局完善 ,在中国、新加坡、美国、加拿大、法国、西班牙、澳大利亚设有分公司 ,并在中国深圳、苏州设立双研发中心。研发人员占比超过70%,拥有400余项全球专利 ,其中发明专利占比60% ,是国家级专精特新“小巨人”企业。Aiper产品在北美和欧洲畅销, 已进入1万多家欧美线下主流实体店。截至目前 ,企业累计出货量近300万台 ,位居行业线上销售份额前列和全球销量的领先地位 ,展现出强大的品牌影响力与市场竞争力。

元鼎智能已形成“泳池机器人+水质治理 +庭院灌溉 ”三大产品和服务矩阵。主要产品包括: 1)泳池清洁机器人 ,从开创无线品类到引入认知级AI ,从被动执行到主动感知决策。其中旗舰机型Scuba V3 Ultra具备六合一清洁与水质管理能力 ,可实现一周无干预全托管智能体验。此外 ,行业首发自充电、自清洁、全自动AI泳池机器人 ,重新定义了全自动泳池清洁形态; 2)智能水质管理一体机EcoSurfer Senti ,融合AI视觉清洁与实时水质监测 ,实现全天候无人干预的水面清洁与水质维护; 3)智能庭院灌溉系统IrriSense系列,依托EvenRain?雨帘技术与实时天气感知 ,实现多区域精准浇灌与节水养护。

元鼎智能的核心竞争优势体现在三方面: 1)技术与产品创新力。率先定义并成为无线泳池机器人品类的开创者 ,将“认知级AI”引入清洁领域 ,构建“感知-理解-决策-自适应”的智能闭环 ,使机器人能在实时环境中自主判断与调整 ,实现从无差别清洁到按需清洁。 同时推出4合1多区域智能灌溉系统Irri Sense2 ,革新传统庭院灌溉形式。2)全渠道布局与市场渗透力。在亚马逊无线泳池机器人品类市占率持续领先 ,部分型号市占率超过50% ,并成功入驻欧美主流零售及专业泳池渠道。 2025年获全球泳池及健康设备领导者Fluidra战略投资并达成深度合作, 同期与全球泳池设备零售领域头部企业POOLCORP达成战略合作 ,突破传统专业泳池渠道壁垒 ,加速全球全渠道布局。 3) 品牌全球化能力。坚持本地化品牌建设与一线用户调研 ,深度融入欧美市场 ,品牌知名度位居行业前列 ,成为消费者信赖的智能庭院品牌。

(三)数字华夏

数字华夏成立于2024年3月 ,是一家专注于具身智能与人形机器人设计、研发、制造及场景化应用的高新技术企业。公司以“让AI惠及每一个人”为使命 ,致力于推动通用人工智能( AGI)机器人的规模化商用。公司核心团队汇聚了来自清华大学、北京大学、圣安德鲁斯大学等国内外顶尖高校及华为等科技企业的顶尖人才 ,兼具“产业家+科学家 ”双重基因 ,研发人员占比高达70% ,具备深厚的技术积淀与产业实践经验。

数字华夏的核心竞争力主要体现在以下几个方面: 1)技术全栈自研与仿生交互壁垒。公司构建了从底层硬件(仿生材料、 自研电机、域控主板)到核心软件(多模态交互大模型、运动控制算法) 的全链路自主研发体系 ,以及独有的多模态仿生交互技术与产品体验, 已申请专利80余项 ,在高精度表情模拟与情感交互方面处于行业领先地位。2)“平台 +生态”双轮驱动的商业化策略。通过“ 巨号 ”智能平台与RAAS场景平台 ,实现从硬件销售向“操作系统+生态服务 ”模式演进 ,支持第三方开发者快速集成与业务落地 ,拓展商业化边界。 3)政企资源与场景落地能力。核心团队具备深厚的大客户服务经验与行业资源 ,产品已进入金融、能源、运营商等高壁垒领域 ,形成从技术到场景的完整闭环验证。尤其在金融场景, 已成为具身智能应用深度与广度上引领行业的人形机器人提供商。未来 ,公司制定了五年百亿营收的长期战略目标 ,并将持续专注于具身交互智能和场景智能 ,深耕应用场景落地。

(四)擎朗智能

擎朗智能( KEENON  Robotics)成立于2010年 ,专注于服务机器人产品与  解决方案的开发与应用。公司依托全栈自研技术体系与“研发-智造-供应链”全链条产业化闭环能力 ,构建了人形机器人、配送机器人、清洁机器人等多品类产品矩阵。凭借自有智能化生产基地与全球化运营网络 ,截至目前 ,公司累计出货量已突破10万台 ,产品进入全球60余个国家和地区的600多座城市 ,业务覆盖餐饮酒店、 医疗康养、工厂商超等全生态场景。公司在全球布局超过80个运营中心 ,并在韩国、荷兰、美国、 日本、 中国香港等地设立子公司或办事机构 ,具备成熟的国际化交付与服务能力。

擎朗智能依托全栈自研体系与全链条产业化闭环能力 ,将“通用 +专用 ”产品矩阵延展为可复用的场景岗位链条 ,率先构建了服务业的岗位单元化理解与执行能力 ,实现服务效率与生产力的提升。在产品与场景协同层面 ,公司提出“ 岗位化”理念并驱动全场景协同:人形机器人承担语义理解、交互与环境适应等通用能力 ,配送、清洁、搬运等专用机器人承担岗位任务 ,形成“通用认知 +专岗执行 ”的协同体系。在酒店等典型商服场景中 ,该模式已完成工程化验证:XMAN-R1承担迎宾引导 ,T系列承担送餐服务 ,W3承担客房配送 ,S100承担行李搬运 ,C40承担环境清洁 ,实现服务流程的连续衔接与状态反馈 ,验证了“ 岗位化”路径的可行性与可复制性。在产业组织层面 ,公司拥有“研发-智造-供应链 ”全链条产业化体系 ,通过自建智能化工厂整合非标件供应链 ,支持多形态产品的定制化量产与行业交付 ,为产品规模化商业落地提供了成本可控与交付稳定的基础保障。 同时 ,公司采取“通用智能 +本地化创新 ”的全球化布局策略 ,在日韩、 欧洲、北美等重点市场建设运营中心和服务网络 ,形成一国一策的适配机制 ,使机器人真正融入各国商业体系 ,推动机器人从产品出口转向“劳动力”输出。


中国具身智能产业未来趋势



(一)技术与产品体系构建

具身智能在世界模型、数据闭环和协作机制的驱动下,将转化为可规模部署的通用劳动力,具身智能将形成从理解世界、到个体行动、再到群体协作的技术演进路径。

推动智能体(如智能机器人、 自动驾驶汽车、 自主航行器等)具备物理常识、因果推理与空间理解能力 ,并最终转化为可规模部署的通用劳动力。从技术路径看 ,具身智能的发展链条可概括为从“单体智能 ”升级到“群体智能”的过程:发展起点在于单体具身智能完成“感知-理解-行动”闭环 ,在真实环境中进行持续交互并提升自主规划与动作决策能力;当单体智能趋于成熟后 ,其能力边界将扩展至多智能体协作 ,通过分工与协调形成更高层次的群体智能体系。在这一演进过程中 ,世界模型起关键支撑作用 ,其通过提供环境理解、 因果推断与任务规划的统一框架 ,使具身智能具备跨场景泛化能力。

当前 ,世界模型深受高质量、多模态、长尾分布的真实交互数据匮乏制约。而未来 ,通过部署大规模具身智能体在多样化场景中并行运行 ,其产生的海量交互与反馈数据 ,将成为反哺和训练更强大世界模型的关键燃料。 随着世界模型成熟并具备可部署性后 ,又将反向赋能具身智能 ,显著提升其单体自主性并支持多智能体协同 ,从而形成“数据-模型-具身-数据”的闭环机制,使具身智能具备可规模部署的条件。 由此可见 ,未来竞争将集中在三项能力上:构建更精准的物理世界模拟器、建立高效的数据闭环体系 ,以及设计可扩展的多智能体协作机制。


21.png


(二)场景与应用落地深化

具身智能的场景落地将沿技术成熟度与环境结构化程度的梯度落地,形成多层次市场空间,根据产业基础、技术成熟度与市场环境的综合判断, 中国具身智能的产业化落地将遵循由易至难、 由专到泛的阶梯式路径。其产业场景将沿梯度演进:

在短期内 ,具身智能将率先在高价值、有确定性的工业制造与特种安全领域实现工程验证与商业落地。工业制造已进入规模化前夜 ,汽车拧紧、 3C精密装配等场景需求正推动精细力控、柔性协作等关键技术加速成熟 ,微弱力觉反馈与异常处理能力将加速提升。 同时 ,特种安全已形成早期付费模式 ,在电力巡检、矿下检修等专业任务场景中已率先实现商业闭环 ,商业模式将沿人机混编、部分替代到无人化班组演进 ,并以RaaS为主要交付形态。

中期阶段, 随着技术可靠性与成本曲线的优化 ,具身智能将渗透至商用与高价值民生服务领域。其中 ,手术机器人与康复机器人依托收益体系明确的高价值医疗场景实现较早商业化; 而送餐、导览等通用服务场景受限于使用频次、替代价值与人机协同成本 ,商业模式将从一次性售卖转向订阅与RaaS,最终在标准化运营场景与规模化部署中形成可持续的现金流。

长期来看 ,家庭陪护与生活助理将成为具身智能的终极普及方向。家庭场景任务高度碎片化且需理解家庭物理常识(如叠衣、做饭等) ,落地依赖世界模型、多模态融合与人类行为理解等底层能力突破。在人口结构变迁与社会需求驱动下 ,家庭机器人有望成为居家养老的重要补位力量 ,覆盖安全监测、移动辅助与情绪陪伴等需求 ,提升家庭照护的连续性。


22.png


(三)市场与生态规模扩张

通用平台与垂直应用分层协作,企业将明确生态位并进行全栈化布局。

中国具身智能市场的竞争焦点正在发生结构性跃迁 ,不再停留于单点应用突破 ,而是转向技术底座、盈利能力与供应链体系等生态层面的综合较量。总体来看 ,具身智能产业竞争呈现三个趋势 :一是竞争维度从单点突破上移至系统协同 ,单一算法模型、本体硬件与演示式Demo的比较优势正在减弱,企业需要在具身大模型、软硬协同、工具链体系与交付运维之间构建全栈协同能力;二是竞争资源从融资能力转向场景与供应链深度 ,可持续付费的真实规模化应用场景将成为真正稀缺资源 ,掌握关键部件、本地供应链与交付能力的企业将在规模化阶段显著占优;三是竞争结果将进入加速出清阶段,缺乏技术纵深与生态基础的参与者 ,如纯集成商、弱供应链企业及依赖概念验证融资的团队 ,将在量产成本、运维可靠性与快速迭代的要求下面临淘汰。

在生态结构上 ,具身智能产业将形成通用基础平台与专业应用模块并存的双轨竞争格局: 一类是通用基础平台 ,头部企业通过具身大模型、世界模型与标准化硬件接口 ,形成基础智能底座 ,商业模式从整机销售迈向平台化与RaaS服务;另一类是专业应用模块, 由垂直领域企业主导 ,其壁垒在于深耕特定行业形成的场景知识( Know-how) 、专用组件开发能力及商业闭环路径 ,通过将通用平台与深度定制结合 ,解决具体产业问题。

未来 ,具身智能企业必将进行全栈化布局 ,其竞争边界将超越技术本身 ,延伸至供应链整合、制造体系、全球服务网络与产业资本联动的生态级竞争。


23.png


版权说明:
1、本文来源:36氪研究院、新材料行业研报。
版权归相关权利人所有,转载部分是出于传递更多信息之目的。智教新媒尊重原创,如涉版权,请联系删除。
2、如果您的文章希望被智教新媒报道,请发邮件到 service@iedumedia.com公邮,会有专人在1-2个工作日回复您。

关注智教新媒公众号