机器人,还当不了打工人,机器人打工视频
定焦One(dingjiaoone)原创
作者 | 王璐
编辑 | 魏佳
人类,正在被人形机器人“圈粉”。
在刚刚落幕的2025世界机器人大会(WRC)上,这群“钢铁战士”成了顶流明星,五天展期里人潮不散,各家展台被围得水泄不通,观众一边惊呼“哇塞”,一边举着手机咔咔狂拍,社交平台被机器人的短视频刷屏。
越来越多人惊喜于人形机器人的进化速度,它们已经不是笨拙的铁疙瘩,而是有了灵巧的双手和双足,皮肤触感逼真到能“以假乱真”,甚至会挑眉、微笑、抛媚眼。
技能点也在全方位进化——
能表演:跳舞、T台走秀、打拳、踢足球等样样精通;能干活:在家务整理、咖啡制作、工业搬运等领域取代打工人;能交流:听得懂人讲话、能进行简单地自然对话,逐步摆脱“人工智障”标签。
但它们也有不少bug——
动作单一:多家厂商机器人跳舞,后空翻和摔倒姿势宛如复制粘贴,被网友调侃“程序员偷懒”;效率不高:叠衣服慢如树懒,工业场景仍停留在基础分拣;价格高昂:一台顶配机器人抵得上一辆宝马。
尽管如此,它们仍跌跌撞撞地离开实验室,正在加速走向现实世界。“马拉松”“运动会”“拳击赛”等各种人形机器人赛事,还在霸屏着国内外媒体。
近期,「定焦One」和几位人形机器人头部企业、资深从业者聊了聊。虽然现在谈大规模应用还为时尚早,“智力”和“成本”仍是瓶颈,但技术进步、资本下注和市场需求正在加速这个进程。未来,人形机器人可能会颠覆我们对劳动、效率和智能的想象。
人形机器人,进化成啥样了?
人形机器人,到底是什么样的存在?它并不像大家想象中那么简单。我们从外观、交互方式和应用场景三方面,来一个全景认知。
先来看看如今的人形机器人长什么样。
通常来说,它们有着躯干、头颈、四肢等类人结构,但实际上,各家的人形机器人形态各异,差异主要体现在手和脚的设计上。手分为三类:灵巧手(采用仿生五指设计,能够模拟人类手部的精细动作)和二指夹爪、三指手,脚则分为双足型和非足型。
在从业者看来,虽然灵巧手和双足设计更接近人类形态,但实现功能却相对基础且价格高昂,一位相关从业者透露,高端灵巧手价格高达10万-20万元。
有着多年互联网和自动驾驶汽车行业从业经验,也是具身智能行业的资深从业者Kris告诉「定焦One」,一对灵巧手的成本可以占到机器人总成本的三分之一,从二指夹爪升级为三指手,虽然只增加了一个手指,成本可能翻了好几倍,但高成本带来的效果未必成正比。
因此,为了提供更好性能以及平衡性价比,人形机器人公司大多都采取了没那么像人的夹爪形式和轮式结构,除非客户有特定需求。
比如,参展厂商星尘智能的Astribot S1演示了做早餐、冲咖啡、画扇子等复杂任务,这些操作都是靠二指夹爪实现的。
图源 / 受访者提供
星尘智能研发负责人安昭辉告诉「定焦One」,人形机器人的操作功能集中在上半身,但不仅仅是靠夹爪,而是依靠整个上半身,所以他们对整个机器人本体的关键部位,采用了创新绳驱传动设计,达到了高度模仿人类肌肉和施力方式,而且在表现更拟人、更高动态的同时,也更安全。
再来看交互方式,Kris解释,控制人形机器人运行的方法主要有三种:遥操(通过传感器、控制器等设备捕捉人类动作)、同构臂(通过关节映射传递到机器人手臂)、语音控制三类。其中比较复杂的指令比如做早餐,采用的便是遥操、同构臂,简单的指令比如推、拿、放,采用的是语音控制甚至可以达到自主运行。
但无论哪种,离真正由AI自主控制都相差很远。即使是看似智能的“语音控制”,也多基于预设规则,机器人只是看上去有了自主意识,但缺乏真正的场景适应能力。
需要指出的是,人形机器人的遥操和遥控车不是一个概念,也需要一定技术水平。
北京大学计算机学院访问工程师,在互联网、自动驾驶、机器人等行业都拥有丰富实践经验的gashero向「定焦 One」解释,人形机器人看上去是有人拿着遥控器进行操作,但遥操实际上发送的是指令,而非直接控制机器人的最底层,还有大量子任务需要机器人自己规划执行。比如需要机器人自己保持平衡,规划身上的多个电机、传感器来综合执行目标动作,具有技术难度。
最后来看看应用场景。
综合从业者的观点,人形机器人可清晰地分为To B(企业级)和To C(消费级)两大方向,其中To B主要指的是文娱表演、工业制造、文旅服务、医疗康养这四大领域。To C集中在家用场景,Kris总结,人形机器人的目标是替代传统的“三保”工作(保安、保洁、保姆)。
Kris表示,文娱表演是目前最为成熟的应用场景,各种舞蹈、T台走秀和竞技比赛频繁出现。而其他场景仍处于基础应用阶段,比如工业制造以流水线上的分拣、搬运为主,文旅服务以景区引导为主。
图源 / Kris的机器人觉醒手记 受访者提供
不过,从实际价值来看,gashero认为现阶段很多人形机器人“上班”后的存在感并不强。
比如在仓库里完成搬箱子任务,仓库AGV机器人(机器视觉+机械臂的组合)已经非常成熟且廉价,人形机器人不具备强竞争力。至于文娱表演,他认为不可持续,“新鲜劲过了,机器人还是要追求创造实实在在的价值。”
总结来说,虽然人形机器人这几年有了很大进步,但想让它们真正发挥价值,还有几道关键门槛。
得过“成本关”和“脑子关”
多位从业者概括,眼下人形机器人的主要难题在于“脑子不够聪明”和“价格不够亲民”。
你可以把人形机器人想象成一个“人”,由“身体”和“脑子”组成。硬件就是它的“身体”,也被从业者叫做本体,软件则是它的“脑子”,掌管着各种思考和行动。
业界的共识是,国内人形机器人的运动性能已经日趋成熟,可以满足基本的操作需求,但比起“身体”的强壮,人形机器人“脑子”的问题很大,目前行业智能化发展严重不均。Kris直言,人形机器人的软件还停留在Demo水平,就像是个刚学会走路的孩子,只能在特定的小范围里走路。
大语言模型之所以越来越聪明,是因为它不停地学习海量数据。人形机器人也类似,但它得在真实的物理环境中进行大量交互操作,从中获取数据来训练自己的决策和行动能力。可现实是,物理世界的操作数据非常短缺,严重限制了人形机器人的发展。
Kris表示,人形机器人的软件构成基本都是VLA的架构,在这个架构下,要让“脑子”认出物体,还要指挥“身体”完成动作,就必须依赖精准真实的空间数据。
比如,让人形机器人去晾衣服,它得知道走到哪儿去晾,那个地方的具体坐标是多少。可现实生活中这部分数据偏偏是缺失的。所以很多人形机器人在完成指定动作时,必须固定在某个地方,拿的东西也必须在它的视线之内,就像被无形的绳子拴住了一样。
但有些人形机器人的智商已经出现了进化。
比如在“收拾桌面”的家务场景中,星尘智能的Astribot S1(依托星尘智能全身VLA模型)在面对很多没见过的物体或异常干扰时,能自主完成收拾杂物的工作,即使将场景挪到WRC现场,也只需补采少量数据,模型就能用。
这背后依靠的是自研模型、本体、过往海量数据的闭环驱动,而其“元技能库”学习法,可以让机器人不断采集各类场景中的交互信息,面对新任务时进行技能迁移,无需从头学起,就像小朋友学习一样,通过举一反三认知世界。
但安昭辉也告诉「定焦 One」,目前人形机器人的通用泛化能力还是整个行业都在头疼的难题,目前它只能对相似的场景进行泛化,做不到像ChatGPT那样回答各行各业的问题,简言之,它还是个垂类专家而非通用专家。
不止一位从业者表示,合成数据是推动具身智能快速落地的关键。以银河通用为代表的企业在具身智能领域专注研究,在“脑子”上达到行业前沿水平。
拿银河通用的Galbot为例,在北京海淀中关村的线下门店,它不用人遥操作,便可自主完成购买接待、点单支付、商品拿取、当面交付、多语音交互引客等全流程。在面对300+冷藏/热饮不同形态的商品时,也能准确抓取且做到不碰倒其他货品。
图源 / 受访者提供
北京银河通用机器人首席战略官赵于莉向「定焦One」透露,这依托的是银河通用自研的全球首个面向零售的端到端具身智能大模型——GroceryVLA,基于大规模合成数据和Sim2Real(虚实融合技术)的技术泛式,GroceryVLA无需针对每种商品单独调参,实现跨品类、跨物体的统一抓取策略,并拥有强大的自主决策与抗干扰能力。
在本次WRC大会上,英伟达Omniverse和仿真模拟技术副总裁Rev Lebaredian和宇树科技王兴兴、银河通用创始人王鹤同框,英伟达宣布已将中国首批Jetson Thor芯片给银河通用使用。在银河通用的WRC展台上展示了全球首款搭载了英伟达Jetson Thor芯片的机器人Galbot G1 Premium,被现场观众评价为“干活最麻利的人形机器人”。
如果说“脑子关”限制了人形机器人的能力,那么“成本关”则决定了它能否大规模普及。
在本次WRC大会上,人形机器人的身价天差地别,但整体都价格不菲,大部分在几十万的区间。最贵的一台将近百万,被网友调侃为“土豪专属”,当然,也有少数“亲民款”,比如宇树科技Unitree G1人形机器人,售价9.9万元,但对普通家庭来说仍不算便宜。
高昂的价格让人望而却步,从业者解释,这并非漫天要价,事实是,造一台人形机器人成本很高。机器人领域很多核心零部件的成本和汽车产业类似,甚至连供应商都是同一拨,硬件成本不低,也让机器人短期内难以像其他家电那样进入千家万户。
比商业化更快的,是上市潮先来了
即便人形机器人面临着智力与成本的双重考验,对于这一行业的前景,市场仍十分看好。
从宏观数据看,行业规模正高速增长。本次2025世界机器人大会开幕式上公布了一组数据:今年上半年,我国机器人产业营收同比增长27.8%。工业机器人和服务机器人产量增长同样显著,同比分别增长35.6%和25.5%。我国已连续12年位居全球最大工业机器人应用市场。
企业端和资本端的热度更胜一筹。
企查查数据显示,截至目前,今年前7个月已注册机器人相关企业15.28万家,较去年同期相比,增长43.81%,增速远超去年全年注册水平。截至8月12日,国内现存机器人相关企业95.8万家。
与此同时,很多企业已经瞄准了资本市场。公开信息显示,目前全球已有超20家人形机器人公司启动IPO或传出有IPO意向,其中中国占16家,包括宇树科技、智元机器人、傅利叶智能等。
各家聚焦的应用场景和优势也都不一样。
比如宇树科技的优势集中在核心技术与商业化落地能力上。其95%以上的核心硬件实现自主研发,在商业化方面,旗下产品G1基础版以9.9万元起的售价展现出高性价比,落地应用已较为成熟。
图源 / 宇树科技官网
智元机器人则主打全链条布局。从硬件到软件均坚持自主研发,同时通过投资机器人产业链上的多家创业公司,构建起产业生态。
傅利叶智能聚焦特定场景深耕,重点发力医疗康复领域。最近推出了首款主打交互陪伴、具备“可触摸”特性的全尺寸人形Care-bot GR-3,其具有社交陪伴和辅助陪护功能,整体外观形似“大白”,还有微表情反馈。
至于如何判断一家人形机器人公司的实力,不同从业者给出了不同参考标准。
gashero认为人形机器人和自动驾驶领域具有一定的相似性,因此也可借鉴其评估方式,先把这些公司进行分类,划分为人工智能(具身智能)和机器人两大派。人工智能派致力于“大脑”——更高的智能水平,机器人派则侧重于“身体”——更强的硬件能力。
在这两派中,gashero认为,“大脑”是人形机器人在未来突破的关键所在,因此更倾向于将数据方面具备更强实力的公司放进第一梯队。
Kris则强调,落地场景对于人形机器人的商业前景起着决定性作用。但如果从这一维度来看,企业梯队划分又会呈现出明显差异,因此他更偏向于认为行业还处在发展早期,人形机器人公司各自在不同的应用领域探索、拓展市场,很难从某一固定维度分出高下。
也有从业者认为,依据估值来划分人形机器人公司的实力,是一种较为直观的方法。
按照这种划分方式,智元机器人、宇树科技、银河通用处于第一梯队,估值超70亿;它石智航、千寻智能、自变量机器人等公司排在第二梯队,估值在20亿-50亿;其余热门公司估值大致在20亿以下。
不难发现,无论是从“大脑”与“身体”的技术侧重,还是落地场景的探索,以及估值规模的评估,不同的维度展现出市场看待人形机器人行业的多元视角,恰恰显示出这是一个高速生长、远未定型的行业。这也意味着,人形机器人的未来,将有无限可能。
*题图来源于星尘智能官网截图。
2、差点忘了,莫言也是当过兵的,看看他这枪法如何?,莫言当过几年兵