首页资讯

具身智能创业不能只泡在实验室,“先用起来比什么都关键”

时间:2025-08-13 17:17 作者:地球本地人

具身智能创业不能只泡在实验室,“先用起来比什么都关键”

“人形机器人要形成生产力,不能满足于娱乐化和遥控操作。”

“做机器人不适合‘掀桌子式’的创业,一定要在真实场景中迭代,不能只在实验室里埋头苦干。”

“没有短期落地,就没有机会、没有资格去谈长期布局。”

8月12日结束的2025世界机器人大会(WRC)上,商业化的迫切性被创业者频频谈起,场景落地已成为具身智能创业公司的“必答题”。

尽管赛道上存在所谓“运动派”和“实操派”的分野,但这不意味着前者只表演不卖货。从“运动派”公司创始人的表态来看,他们并非意识不到“干活”才是真谛,也并非不清楚科研教育、导览表演等市场的“天花板”,更多是对商业化的短期打法存在不同判断。不可否认,主打提供情绪价值的“运动派”,确实从流量红利中挣到了实实在在的订单。

人形机器人“干活”面临的最大挑战在于,具身智能模型能力不足。这几乎是这条充满非共识赛道上的一项共识。但对于如何提升模型能力,业内的关注重点显现差异。主流声音认为,数据不足是模型能力难以泛化的短板。但宇树科技创始人王兴兴则在WRC期间反思称,现在最大的卡点是模型问题而非数据问题,“具身智能机器人模型架构都不够好”。

创业公司背后的投资机构亦愈发强调商业化能力。首程资本管理合伙人朱方文介绍,去年投资时主要看团队、技术路线和Demo(演示)效果,今年则纳入量产交付能力的评价指标。君联资本董事总经理纪海泉也直言:“我不需要你的技术是世界上特别前沿的,只能留在实验室没法商用,我们还是要看到PMF(产品市场匹配度)。”

根据朱方文给出的预测数据,今年全球人形机器人的出货量将突破1万台,预计有5到6家企业的出货量超过1000台,但都限于相对比较窄的应用场景。明年这一出货量数据有望翻倍甚至更多。

“运动派”在质疑声中出货

8月1日,松延动力参照车企发布月度交付量的形式,披露了7月公司量产交付105台人形机器人,而6月的交付量为38台。

这家创业公司凭借北京亦庄机器人半程马拉松“走红”。受益于此,松延动力方面称,在机器人马拉松后的1个月内获得超2000台意向订单,合同额超1亿元。其中,教育教具和商业演出市场占比超60%,文旅展厅需求激增。

“这些场景没那么高大上,但具有一定的确定性。”松延动力董事长姜哲源在WRC期间透露,公司组建了一支渠道运营团队,面向教育场景、文旅场景等进行市场开拓。当下,几乎每个省市至少都有一家合作的渠道商。基于这些商务能力,姜哲源想把现有的几个场景“打穿打透”。

王兴兴也在WRC一场论坛上提到出货情况:今年,宇树科技的小尺寸人形机器人G1几乎是全球出货量最高的一款人形机器人。王兴兴接受南都等媒体采访时说,1.2米左右的小尺寸人形机器人更轻巧、更灵活,非常适合娱乐、互动或其他二次开发,“如果让它‘干活’,多少有点为难它了”。

在业界,宇树科技、松延动力、众擎机器人、加速进化等由于擅长机器人跑步、跳舞、格斗、空翻、踢球等技能,被归类为所谓的“运动派”。虽然这些公司收获了线上线下诸多流量,但也面临诸多的质疑——集中指向落地场景的商业化价值有限。

但众擎机器人创始人赵同阳认为,当人形机器人具备足够的行走、奔跑、舞蹈能力之后,便可以在安防巡检、游乐园、学校等这类简单的场景先用起来,“虽然这些市场撑不起千亿的市值,但这毕竟只是刚开始”。

加速进化在6月下旬曾举办一场不借助遥控手柄的机器人足球赛。该公司创始人程昊认识到,机器人赛事有机会通过卖票、卖周边、寻找赞助商等方式,跑通商业闭环。尽管目前的受众群体偏小学生和初中生,但程昊预测,后续随着机器人踢球的观赏性增加,观众群体将更丰富。

从公司宣传物料来看,“运动派”也热衷于打低价标签。近期,宇树科技发布一款起售价3.99万元的小尺寸双足人形机器人R1,再度巩固外界对其“价格屠夫”的印象。


宇树科技新款小尺寸双足人形机器人R1。图:杨柳

有业内受访者认为,“运动派”选择的场景门槛低,导致定价只能一降再降。但王兴兴就定价策略回应称,希望通过更有竞争力的价格,让更多人愿意采购。人形机器人产业生态的建立,必须依靠足够多的出货量,让足够多的人去使用。

外界对“运动派”不乏误解,比如只做硬件和运动控制,不做具身智能“大脑”。王兴兴对此表示,尽管投入谨慎,但宇树科技一直非常重视机器人“干活”这件事,在数据采集等工作上花费了大量精力。据其透露,针对上肢操作的AI研发团队,其规模是公司内部最大的。之所以对外宣传少,原因是公司希望打造出复合多种能力的通用型AI,能胜任不同工作场景,而不是限于单一功能的AI。

“实操派”在简单场景上岗

8月11日,智元机器人披露一笔数千万元的采购订单:近百台轮式双臂机器人远征A2-W将落地富临精工工厂,负责料箱拆垛及上料工作。

此前7月中旬,优必选中标一项来自汽车领域的工业人形机器人采购项目,金额高达9051.15万元。优必选副总裁、研究院院长焦继超透露,预计今年交付500台工业版人形机器人,面向汽车、3C半导体等行业客户,其中以汽车客户为主。

记者在WRC展厅看到,工业场景的落地方向已逐渐收敛趋同,搬运、分拣和质检工作成为不少公司展示的核心。

乐聚的人形机器人已进入一汽红旗、海晨物流等公司的产线,从事物流搬运任务。乐聚机器人副总裁柯真东对记者表示,搬箱子、上下料、分拣属于工厂内相对简单、工作流程比较短的工序。以搬运为例,人形机器人的效率虽然目前仅为人工的1/3到1/2之间,但可以通过更长的工作时间去弥补。而对于拧螺丝或更高精度的工作,“(机器人)连进入工厂的门槛都没达到”。

走访许多工业客户之后,柯真东发现,一线和准一线城市的工厂面临“招工难”,对人形机器人有着真实的需求。此种情况下,与其说人形机器人在“抢饭碗”,不如说是去顶替空缺。但对于引进人形机器人,工业客户要计算ROI(投入产出比)。柯真东说,乐聚卖给工厂的售价约为20万至30万元一台,以此比对用工成本,基本上一年半到两年即可回本。

根据柯真东提供的数据,今年乐聚的整体交付目标是1000至2000台人形机器人——以科研、导购等商用服务场景为主,工业场景有小批量出货。

为了更适配工厂的环境,乐聚、优必选、智元、智平方这些探索工业场景的整机公司,均发布了轮式双臂机器人。智平方副总裁莫磊告诉记者,硬件形态不要做得过于酷炫,而要为量产而生。


智平方的爱宝系列机器人。图:杨柳

据了解,智平方的爱宝系列机器人已产生商业化订单,进入东风柳汽、吉利科技旗下半导体企业晶能微等工厂部署应用。莫磊说,机器人真正进入客户真实场景至为关键。没有落地使用,就没有数据;没有数据,产品就无法迭代;而客户也无法感受到产品的进展。归根结底,“先用起来比什么都关键”,持续提升模型能力是做好商业化的前提。

莫磊认为,工厂这类半结构化场景属于“跳一跳够得着”的落地目标,从简单的工种做起,“不要觉得不酷炫就不去做”。但智平方暂时不会考虑难度高、存在伦理风险的C端交互服务场景,也不会为了寻求立刻的商业化,去做一些门槛低、对未来发展缺乏助益的事情——比如,机器人炫技表演的商业化价值可能并不大。

“实操派”为人形机器人设定的“打工”路径亦有内部分化。银河通用、千寻智能等创业公司,首选了药店、商店等零售服务场景。这类场景考验人形机器人对不同形态货品的精准识别和抓取能力。

硬件够用但不够好,具身模型非共识涌现

人形机器人“上岗”,离不开硬件、负责运动控制的“小脑”以及负责推理决策的“大脑”紧密配合。

在王兴兴看来,人形机器人的硬件总体来说是够用的,但距离好用还有差距。若要实现低成本、高可靠性和大规模应用,硬件仍需不断完善。

高成本、使用寿命、硬件一致性、关节模组功率密度等仍构成本体层面的挑战,通信和算力问题也开始受到重视。记者了解到,当下,一台人形机器人大多搭载一块英伟达Orin芯片,最高算力为275Tops(每秒275万亿次运算)。在一些业内人士看来,如果机器人在场景中自主运行,这一算力规模远远不够。

王兴兴提到,受电池功耗等的制约,无法在人形机器人本体上部署大规模的端侧算力,但机器人未来对大规模算力的需求是毋庸置疑的。为解决算力不足的短板,王兴兴提出的应对办法是分布式算力,让机器人直接接入工厂内的近距离服务器,避免连接远距离集中式算力中心带来的通信延迟。

乐聚则把视线投向5G-A通信模组,和中国移动、华为联合打造了基于5G-A的人形机器人。柯真东解释称,人形机器人执行中长程任务的推理规划时,可以借助更低延迟的通信去接入部署在边缘侧的算力,以弥补端侧算力的不足。

和硬件相比,行业对机器人“大脑”的讨论声量更为浩大。尤其是王兴兴在WRC期间的一番发言,激起业内关于具身智能模型技术路径的争论。

王兴兴的观点是,具身智能模型完全不够用,效果乏善可陈背后的最大问题在于模型架构不够好、不够统一,而非数据问题。他说,大语言模型只要数据量足够大、质量足够好,模型性能就能快速提升。但在机器人领域,即便积累了海量数据,并在此基础上训练一款模型,但放到实体机器人上可能依然无法很好地对齐。然而,全球范围内对机器人数据短缺问题的关注度很高,反而欠缺了对模型问题的关注。

王兴兴上述发言针对的模型架构是VLA(Vision-Language-Action,视觉-语言-动作),他发现这类模型面临数据数量和质量双重瓶颈,在真实世界进行交互时的泛化性无法达到预期。

今年以来,VLA具身模型备受行业热捧,意在让人形机器人能通过视觉信号感知世界,听从人类的语言指令,并将指令拆解转化为具体的操作。

在VLA模型中,行业又衍生出“单一端到端”和“快慢双系统”等路线。前者将图像、语言指令作为输入,直接输出动作,具身智能公司Physical Intelligence发布的π0模型即采用这种方案;后者以美国Figure AI公司发布的Helix模型为代表,可理解为模块化的机器人“大小脑”协同方案,“快系统”类似于人类的本能反射,快速执行简单任务,“慢系统”则侧重深度思考和决策。“快慢双系统”架构是当前的热点趋势。

有学界研究者认为,“大小脑”协同的方案,是当前实现具身智能更易落地的技术路线。亦有业内人士告诉记者,VLA模型可以称作主流路线,但未必是唯一的路径,也不一定是最终的解决方案,因为其尚未在现实场景得到验证。

“如果具身智能模型的架构没有定位清楚,数据的定位也就不会清楚。”乐聚机器人董事长冷晓琨对VLA路线亦持观望态度,但为了短期内让机器人先用起来,乐聚的做法是通过“原子技能”式的训练方式,使机器人掌握料盘分拣、空箱搬运等底层能力。

模型架构之外,真机数据与仿真合成数据两大阵营的“持久战”依然延续。以银河通用创始人王鹤为代表的一方,不遗余力地强调仿真合成数据的重要性,主要原因是真机数据采集效率低、成本高。机器人“上岗”前,王鹤声称只需用少量真机数据进行后训练。

与之针锋相对的“真机数据派”认为,尽管仿真数据具有采集快、成本低的优势,但会面临Sim2Real(仿真迁移到现实)的效果差距。智元机器人合伙人、具身业务部总裁姚卯青此前向记者提到,普通的仿真器很难把真实世界的复杂特性加以抽象化。

技术路线争议之下,英诺天使基金合伙人王晟提醒:“在技术范式没成熟和收敛之前,往任何一个方向高歌猛进,都可能是在错误的道路上跑得很远。”

采写:南都N视频记者 杨柳 发自北京

Top

1、西班牙7月通胀率升至2.7%

2、沪指突破去年924行情高点,回顾股市的历史性变化,“慢牛”可期

3、经济学家解读2025上半年中国经济关键词(经济形势理性看),2026中国经济

小编推荐

当前文章:http://www.share.tuanjian7.cn/MHC/detail/yncjhq.html

相关阅读

网友评论

我要评论

发表
取消
地球本地人