
从智能汽车到人形机器人,小鹏正在构建自己的“物理AI”版图。本文深度解析IRON机器人的技术架构、落地路径与争议焦点,揭示其背后的组织战略与生态野心。在AI从云端走向实体的关键节点,小鹏的选择,或许预示着下一轮智能硬件的竞争逻辑。
一、执行简报:一场引发全球激辩的“类人”演示2025年11月5日,小鹏汽车举办的AI Day活动成为其战略转型的分水岭。此次活动的核心信息是,小鹏不再仅仅是一家汽车制造商,而是将自身重新定位为一家全面的“AI公司”和“全球具身智能公司”。
首席执行官何小鹏推出了贯穿全场的“物理AI”(Physical AI)概念,其定义是将先进的人工智能(AI)融合到物理产品中。这一统领性的战略明确地将公司的四大产品线——个人电动汽车(EV)、自动驾驶出租车(Robotaxi)、“飞行汽车”以及新一代人形机器人IRON——联系在一起。
全场的焦点当属新一代IRON人形机器人。它以一场令人惊艳的“猫步”表演(catwalk)首次亮相。这场演示之所以引人注目,在于其“自然、流畅的动作”、“高度拟人化的姿态”以及“猫科动物般的优雅”。尤其是当一个具有“明显类人、女性形态”的模型登台时,其所展示的逼真度立即在社交媒体上引发了爆炸性讨论。
这场演示的成功之处,恰恰在于它过于逼真,以至于引发了一场全球性的舆论风暴。何小鹏本人也提到,即使在彩排期间,公司内部的同事也曾发出疑问:“IRON里面是不是藏了个真人?”。
选择“走猫步”而非展示一个简单的“工厂任务”,是一项深思熟虑的媒体策略。一场简单的行走只能证明运动能力,而一场“猫步”则展示了机器人对高级流动性、平衡性以及双足动态的精妙掌握。小鹏汽车选择展示这种美学上的、高度拟人化的品质,这本身就是对竞争对手那些动作相对僵硬的演示的一种含蓄挑战。随之而来的“是不是真人”的争议,虽然带来了公关挑战,但从根本上说是其演示效果空前成功的直接结果。
这一事件将IRON机器人塑造成小鹏汽车全新“物理AI”身份的物理化身——即“身体”。2025年的AI Day并非一场汽车发布会,机器人、VLA 2.0 AI模型和Robotaxi才是真正的主角。这标志着小鹏正在进行一场类似于特斯拉的战略重组。因此,IRON绝非“副业”,而是支撑其未来整体战略的核心统一支柱。
IRON的首次亮相引发了一场持续数日的舆论旋风,其复杂性可分为四个阶段:
第一阶段:CEO的首次“辟谣”视频面对社交媒体上压倒性的“真人扮演”质疑,何小鹏在24小时内迅速作出回应。他在微博上发布了一段“未经剪辑的”视频,坦言团队对此“既高兴又好笑”,也感到“既荣幸又沮丧”。
该视频提供了初步的证据,旨在平息舆论:
听觉证据:何小鹏解释说,站在机器人旁边,可以清晰听到“散热系统和一点风扇噪音”。物理证据:他展示了机器人的手部,强调其尺寸“对人手来说太小了”。传感器证据:之前被误认为是“耳朵”的结构,被证实是“麦克风阵列”。“拉开拉链”:最具决定性的证据是,工作人员被要求当场拉开机器人背后的拉链,露出了内部“复杂的机械和电子底盘”。虽然“真人扮演”的说法基本平息,但一个更细致、更技术性的批评浮出水面。一些分析师和机器人技术专家提出,舞台上进行“猫步”表演的机器人,可能并非最新一代的IRON硬件,而是旧款的“OG Iron”模型套上了新发布的外壳。
这一说法的依据非常具体:舞台上机器人的手部设计和下肋骨框架的视觉特征,与旧款R&D平台的特征“更吻合”。
小鹏汽车通过“拉链”视频有力地回击了“是否是真人”的质疑,但似乎从未公开回应过这个“是否是旧硬件”的技术性疑问。这暗示了一种可能性:舞台上的“猫步”演示是一场软件演示(即由新VLA驱动的步态算法),运行在一个经过改装的、更成熟的旧硬件平台上。而技术演讲中提到的新硬件(如82个自由度、新版手掌),是CEO所说的“最终预研版本”。在研发过程中,将软件和硬件解耦测试是惯常做法,这并不意味着演示是“假的”,而是它可能是一场混合演示。
第三阶段:CEO的“剖腿”回应几天后,在另一场活动上,何小鹏再次回应了争议,但这一次的情绪截然不同。他引用了电影《让子弹飞》中的一个著名场景——为了证明清白而被迫“剖开肚子”。
他明确地将外界的质疑定性为“对中国国内科技公司的偏见”,他表示:“人们不相信一个强大的机器人技术能来自一家中国公司……这限制和束缚了我们,就像十年前很多人不相信中国的新能源汽车能做好一样。”
为了“平息争议”,他现场让团队在IRON机器人通电时切开了其腿部的“皮肤和肌肉”,并称这是“我们最后一次证明机器人就是它自己”。
这次“剖腿”不再是技术层面的回应,而是一次政治和叙事层面的回应。第一次“拉拉链”是为了回应全球技术爱好者的疑问;第二次“剖腿”则是面向国内观众。通过援引《让子弹飞》和“偏见”,何小鹏巧妙地重塑了整个事件的叙事框架。故事从“他们是否造假?”转变成了“我们的技术如此先进,以至于外界拒绝相信一家中国公司能做到”。对于微信公众号文章而言,这是一个极具传播力的叙事角度,它将一场技术辩论升华为一个关于民族自豪感和非对称质疑的故事。
为这场风波火上浇油的是,美国Figure AI公司的首席执行官Brett Adcock在X(前身为Twitter)上公开指控小鹏汽车涉嫌模仿。他写道:“哈哈,他们抄袭了我们Figure 01的整个脊柱/臀部设计”。
这一指控完美地契合了小鹏汽车的历史包袱和其最新的“偏见”叙事。一方面,小鹏汽车过去曾面临“抄袭者”的指控,最著名的是特斯拉就Autopilot(自动辅助驾驶)提起的诉讼。Figure的最新指控为批评者提供了新弹药。但另一方面,这也为何小鹏的“偏见叙事”提供了“证据”——即西方公司习惯性地将中国的技术突破贬低为模仿。
这构成了一个复杂的“鸡生蛋还是蛋生鸡”的困局:这究竟是工程师们趋向同一最优解的“趋同进化”,还是公然的“抄袭”,亦或是一场美国竞争对手对中国突破的习惯性轻视?截至目前,小鹏汽车尚未对Figure AI的指控作出正式回应。
三、核心解剖:解构IRON的“极端拟人化”“骨骼-肌肉-皮肤”的设计哲学小鹏汽车明确其设计哲学为“极端拟人化”(Extreme Anthropomorphism)。这并非纯粹的美学追求,而是一项由数据驱动的战略选择。
何小鹏解释说,类人形态对于“从人类身上收集有价值的数据”至关重要。他认为,如果机器人的结构“与人类完全不同”,那么它在以人类为中心的空间(如家庭、办公室)中收集到的数据将“无法泛化”。
该机器人的架构被描述为“骨骼-肌肉-皮肤”,其特征包括:
仿人脊柱(骨骼):采用仿生或“类人”的脊柱结构。仿生肌肉(肌肉):配备“仿生肌肉”或“人造肌肉”。柔性皮肤(皮肤):拥有“全包覆柔性皮肤”,触感“柔软”且“更温暖”。触觉传感:这种皮肤并非装饰,它内置了“触觉传感器”以实现交互。核心硬件创新:行业首发全固态电池IRON一个最重要但可能被低估的特性是,它是首款使用全固态电池的人形机器人。
这一创新至关重要。该电池提供了“超高能量密度和极高的轻量化”特性。固态电池是实现“极端拟人化”设计的关键赋能技术。相关资料明确指出,固态电池使“功率提升30%,重量减轻30%”。这种显著的减重(使机器人保持在70公斤)是实现其“轻盈、温柔步态”的物理基础。同时,这也极大提升了安全性,这对于一个设计用来与人类近距离互动的机器人而言是不可或缺的。小鹏汽车很可能在利用高价值的机器人领域来“推动固态电池的规模化生产”,待技术成熟、成本降低后,再反哺其汽车业务。
规格分析与数据差异解析关于IRON的具体规格,不同来源的数据存在冲突,这反映了产品正处于快速的公开迭代过程中。这些“冲突”并非错误,而是其技术演进的证据。数据清晰地展示了从2024年模型到2025年R&D模型,再到2026年量产模型的演变路径。
例如,AI Day上展示的178厘米/70公斤模型是“最终R&D版本”。但CEO已经确认,2026年的量产版本将会不同,并且“身高不高于170厘米”。在撰写相关文章时,必须解释这种演进,而不是简单罗列一组“正确”的数字。
四、“大脑”与神经系统:小鹏的统一AI技术栈AI计算平台:自研图灵(Turing)芯片IRON的“大脑”由三颗小鹏汽车自研的“图灵”(Turing)AI芯片驱动。这些芯片不仅用于机器人,它们构成了一个“图灵平台”,旨在为小鹏所有产品(包括汽车和飞行汽车)提供可扩展的AI计算能力。其总算力极其庞大,如上表分析,达到了2,250 TOPS或3,000 TOPS。作为参照,微软为“AI PC”定义的基准算力仅为40 TOPS。
AI架构:“物理世界基础模型”机器人运行在小鹏的“物理世界基础模型”之上。这不是单一模型,而是三个大型模型的融合体:
VLT(Vision-Language-Task):被描述为机器人自主行动和决策的“核心引擎”和“大脑”。VLA(Vision-Language-Action):从自动驾驶(ADAS)部门移植过来的模型。VLM(Vision-Language-Model):同样源自汽车部门,负责感知和理解。创新焦点:VLA 2.0 与“反射式”机器人此次发布会上最重大的AI突破是小鹏的VLA 2.0模型。
传统AI(V-L-A)的工作方式是:1) 看到(视觉),2) 用文本描述场景(语言),3) 基于文本决定一个动作(行动)。小鹏的VLA 2.0取消了语言翻译步骤。它采用了一条全新的“视觉-隐式Token-行动”路径。
这种“完全消除了语言瓶颈”的设计,是创造一个能在现实世界中高效运作的机器人的关键。一个必须用语言“思考”的机器人反应太慢,它无法接住掉落的杯子或躲避突然出现的人。通过创建一种直接的“视觉到行动”的“反射”,小鹏正在从一个深思熟虑的AI转向一个直觉AI。这对于任何在动态、不可预测的人类空间中互动的“物理AI”都是至关重要的。
传感器阵列:“纯视觉”战略IRON的传感器套件以视觉为主,这与其电动汽车的战略如出一辙。
视觉:“鹰眼”(Eagle-Eye)720度视场(360°水平+360°垂直)。由“先进的AI摄像头”和“深度摄像头”支持。听觉:位于“耳状凹痕”中的麦克风阵列,用于听觉感知和交互。触觉:嵌入在“全覆盖软性皮肤”中的“触觉传感器”。机器人的传感器配置中没有提及激光雷达(LiDAR),这并非疏忽,而是一项战略特性。小鹏汽车最新的自动驾驶AI技术——“AI鹰眼视觉解决方案”(AI Hawkeye Visual Solution),正是一个明确的“纯视觉”系统,它移除了激光雷达。为了实现与汽车业务高达70%的软件/AI复用率,IRON机器人必须采用纯视觉方案,以便利用这个全新的“鹰眼”技术栈。与小鹏的汽车一样,IRON机器人是其对“纯视觉”未来的一次豪赌。
五、战略总体规划:为什么一家电动汽车公司要制造机器人核心优势:70%的研发协同效应小鹏的优势不在于制造机器人,而在于它已经完成(或正在进行)70%的工作。高管们表示,机器人的软件和AI层面与智能汽车业务的复用率高达70%。VLA和VLM模型正是从“自动驾驶部门移植而来”。这意味着汽车业务积累的多年道路数据和数十亿的研发投入,被直接转移到了机器人身上。
这种研发协同效应是双向的。机器人从汽车的AI中受益。但机器人是一个远为更难的命题,它需要控制82个复杂的关节,而不是汽车“更简单的定向运动”。通过解决机器人这个更棘手的问题,小鹏的工程师们正在构建一个更强大、能力更冗余的AI。当这个AI被反向应用到“更简单”的汽车问题上时,将使其车辆变得异常强大。机器人正在加速小鹏核心EV“大脑”的进化。
“全栈”理念小鹏汽车坚持内部的全栈式研发。何小鹏解释说:“机器人的硬件必须由其软件设计来驱动……只有当两者协同开发时,硬件才能完全配合其运行的AI模型”。
这是对“特斯拉模式”的复刻,也是对“英伟达模式”的拒绝。“英伟达模式”是向任何硬件制造商出售通用的芯片和AI技术栈。而“特斯拉/小鹏模式”则认为,要实现一个可规模化量产且软硬件真正对齐的产品,必须共同进化自研芯片(图灵)、自研AI(VLA)和自研硬件(仿生脊柱)。这条路更慢、更耗费资本,但小鹏相信这是通往可扩展的、非原型机器人的唯一路径。
六、商业化路线图:务实的市场策略2026年量产目标小鹏汽车设定了一个清晰、激进且公开的时间表:在2026年底实现先进人形机器人的“规模化”或“大规模”生产。这包括2026年生产1,000台机器人的目标,同年其“飞行汽车”的产量目标为10,000台,显示了其在“物理AI”产品上扩大规模的巨大决心。
务实的市场进入策略:避开工厂和家庭与竞争对手不同,小鹏汽车的初步战略异常清醒和务实。何小鹏明确表示,他们将暂时避开:
工厂:商业策略“避开工厂”。原因:何小鹏指出,像“拧螺丝”这样的任务试验并不可行,复杂的手部在执行此类任务时“最快一个月就会磨损”,而且在中国,“雇佣人力工人的成本效益远高于使用机器人”。家庭:家庭市场也暂不进入。原因:“安全”是首要关切,以及在非结构化、杂乱的家庭环境中实现“泛化”面临“巨大挑战”。初始目标应用:“礼宾”机器人小鹏的初始策略优先考虑低风险、高曝光度的商业和公共服务场景。
IRON的首批工作将是:导游、导购、客户服务和接待。
首个部署地点将是小鹏自己的零售门店。
这是一个面向公众的Beta测试策略。展厅是一个“半结构化”环境:它比家庭更安全,比工厂更温和。该策略使小鹏能够在真实世界中测试其机器人(“收集真实数据”),同时产生营销价值(“穿着不同服装”),且不会带来安全或硬件损耗的风险。这个“工作”本质上是为大规模、真实世界的数据收集打掩护。
与宝钢的合作:一个研发实验室宣布与大型钢铁制造商宝钢集团(Baosteel)建立生态系统合作伙伴关系,这听起来像是一个工厂应用,但事实并非如此。
相关报道澄清,机器人将被部署在宝钢,以“探索应用场景”并在“巡检等复杂工业领域”进行“迭代和进化”。
换言之,小鹏正在将宝钢作为一个“数据工厂”,学习如何在工业环境中运作,而不是作为客户向其出售机器人。这与“避开工厂”的策略一致;他们不是去工厂工作,而是去那里训练。
平台战略:向全球开发者开放SDK商业计划的另一个关键支柱是“开放IRON机器人的SDK(软件开发工具包)”。其目标是“与全球开发者共同构建人形机器人应用生态”。
这是经典的“平台”玩法,旨在解决“机器人能做什么?”的根本问题。小鹏(拥有超1000人的机器人团队)正在打造“iPhone”(硬件平台和核心操作系统)。通过开放SDK,他们邀请全世界来开发“Apps”。这将比小鹏单独探索快得多地发现有价值的用例,从而在IRON生态系统中建立开发者“护城河”。
七、结论性分析:全球机器人竞赛中的“特洛伊木马”最终论点:“向导”是“平台”的特洛伊木马2025年的IRON机器人是一个“特洛伊木马”。其初始产品——一个售价约15万美元的“向导机器人”——可能看起来很简单。但这个简单的“工作”只是一种伪装。
在这个“向导”的躯壳内,是世界上最先进的通用机器人平台之一。它包含了行业首个固态电池,一个“反射式”的VLA 2.0 AI模型,以及一个强大的2,250+ TOPS的自研计算引擎。
小鹏正在将“F1赛车引擎”装进一辆“教练车”。其目的不是让这辆车今天就赢得比赛,而是为了让这个引擎为未来的每一场比赛学习赛道。
“不公平优势”:小鹏的底牌尽管特斯拉、Figure 和优必选(UBTech)等竞争对手实力强大,但小鹏拥有一个独特的“不公平优势”:其成熟的、大规模量产的EV业务所带来的70%研发协同效应。
它并非从零开始。它正在利用一个已存的、价值数十亿美元的AI、芯片和制造理念的研发管线。这种协同效应极大地降低了其机器人业务的风险,并使其2026年的量产时间表远比纯粹的初创公司更为可信。IRON不仅仅是一个新产品;它是小鹏汽车十年来所构建的AI平台的最终、最合乎逻辑的延伸。
本文由 @像素呼吸 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
易配网提示:文章来自网络,不代表本站观点。