时间:2025-08-03 22:11 作者:爱吃白菜
观察者网WAIC直播实录:AI大潮下的具身和人形,中国在跟跑还是并跑?,观察者网主播叫什么
当特斯拉Optimus再度更新、波士顿动力Atlas秀后空翻,全球目光再次聚焦“具身智能”与“人形机器人”。观察者网在2024 WAIC现场邀请智源、美的、格灵深瞳、真格基金四位一线操盘手,追问一个核心命题:在AI大潮奔涌的当下,中国究竟是在“跟跑”美国的脚步,还是已经与之“并跑”甚至准备“弯道超车”?从电机供应链、强化学习算法,到落地场景与资本路径,这场一个半小时的尖峰对话给出了答案——也留下了更大的悬念。
以下是7月27日上午,北京智源人工智能研究院研究员赵仲夏、美的人形机器人创新中心主任奚伟、格灵深瞳技术副总裁兼算法研究院院长冯子勇、真格基金投资经理陈勉诺在观察者直播间的对话实录:
从左至右:北京智源人工智能研究院赵仲夏、美的集团奚伟、格灵深瞳冯子勇、真格基金陈勉诺 (点击观看直播回放)
文字实录:
赵仲夏:各位线上的观众大家好,欢迎来到 WAIC 观察者网直播间,现在我们在 WAIC 的现场,看到进场的时候会有一个镇馆之宝,是我们的人形机器人。我们本次直播的主题是“具身向左、人形向右——的人工智能和机器人产业将走向何方?”,首先我们来问一下奚老师。我们知道在大众的理解中,美的是一个家电或者是一个智能硬件的品牌,我想知道为什么美的要去做人形机器人?做人形机器人的初心是什么?
赵仲夏:原来美的不只是一个家电公司,还是一个智能制造的公司,同时还是一个机器人的公司。说到智能制造,我想知道美的从2016 年收购库卡到现在已经快十年了,这十年中我们服务的主要客户是什么?
奚伟:库卡机器人在服务的行业有很多,目前主要集中在是汽车制造,同时也在像3C、船舶、飞机制造方面以及一些相关拓展。除了库卡机器人之外,我们还有其他的一些行业,比如物流、电商相关行业,美的服务的行业跨度是非常大的。另外,美的本身也在制造行业,也需要很多机器人的支持,所以库卡机器人在我们所有的美的灯塔工厂,应用量也非常大。
赵仲夏:太棒了,汽车制造、船舶,都是中国制造业最关键的行业。然后我们来问一下冯院长。我们知道格林深瞳应该是中国第一家 AI 领域的计算机视觉公司,也是中国第一家上市的 AI 领域的计算机视觉公司。能不能跟我们介绍一下格林深瞳和您这边所在研究院?
冯子勇:对,格林深瞳是首个科创板上市的 AI 企业,在2013 年开始到现在已经 12 年,我们一直深耕的是视觉技术。主要做的是图像,还有视频的分析跟理解。先介绍一下业务,譬如在金融行业,我们为金融银行的上万家营业网点,做边缘端加中心端的视频分析,在安防领域大家比较熟悉了,像人脸、人体、车辆这些都已经落地到千家万户。我们最近也新增了大模型相关的工作,譬如说以文搜图,帮助公安去找人更有价值。另外关于人体分析这一块,我们也进入到智慧体育方向,我们帮助中小学做体育考试训练,帮助中小学生们提升体育素养。随着大模型的发展,我们也做了一些信创的这个工作,像 AI PC 大模型一体机,也在我们的产品范围内。再如刚才讲到的视觉技术,我们发布了自己的视觉基础大模型,叫MVT,最近有一个更新的版本,等一下再详细介绍。
赵仲夏太棒了,格林深瞳在大模型时代依然有自己的动态、多模态的基础模型诞生,这很难得,因为多模态赛道已经没有太多玩家了。然后是勉诺,至少从我一个外行人角度思考,真格基金应该是我最开始听到的三家投资机构之中的一家。能不能介绍一下真格基金在做什么?您个人会比较关注什么方向?最近有没有在投一些好玩的项目?
陈勉诺:真格基金是一家早期风险投资机构,主要是面向天使阶段投资,我们最开始由新东方的联合创始人徐小平老师和王强老师创办,一直关注前沿科技领域,在 AI 和机器人领域我们一直有超前的布局,像之前投的月之暗面、Manus、Genspark、Momenta、包括格林深瞳等都是作为第一轮投资人进行投资的创业项目,我们希望能够在这个时代去推动创业者在新的科技领域去做一些早期布局,能作为投资机构给大家助力。
奚伟:好的,人形机器人一直是一个大家关注的热点,最近可能更热一些。其实早在 70 年代,人形机器人就开始发展了,中间也发展了很多代。但我觉得比较有特色的就几个。一个是 2000 年的时候,本田出的阿西莫机器人,2011年又做了一些改版。然后是波士顿动力的Atlas,都是一个标杆性的产品,但从我们历史发展来看,之后到 2022 年,特斯拉发布了 Optimus 之后,把人形机器人带到了一个新高度。
我觉得中国中间的过程主要是刚开始的时候,我们的机电系统没有那么强,学习能力、对机器人的控制能力也不够,就导致了机器人发展一直在停滞不前。随着如今强化学习、具身智能、大模型的一些突破性进展,让人形机器人得到了一个巨大发展。人形机器人,顾名思义就是像人一样的机器人,它的复杂度在于,如果像人一样去做,我们知道人大概身上有 200 多个骨头,所以就有 200 多个关节。如果做这么复杂、精密的系统是非常困难的。
当然我觉得是离实际的应用还有一段距离,但随着技术的不断发展, 5 到 10 年之内应该会有很大进步。
从应用角度来去看,现在人形机器人是有一定瓶颈的,大家还在探索阶段。最近看到有几个新的投资事件,比如上汽要引入 500 台人形机器人,真正进工厂开始做尝试。所以我觉得通过应用的牵引,会使人形机器人发展迭代速度越来越快,我也相信在未来3到5年,整个机器人产业的发展会有一个巨大进步。从产业链的角度来去看,人形机器人这几年,尤其是核心部件产品,包括关节模组、传感器也有巨大的进步,所以成本会大幅下降,这些都是机器人大发展的重要原因。
赵仲夏: 好的,我们感觉就是人形机器人已经发展很多年了,就像您刚刚聊到的,日本那边有阿西莫,美国 20 年前就开始做波士顿动力,也有一些出圈的工作,但从来没有像最近的中国和美国一样百花齐放。此外,以前都是一两个出圈的机器人,这次感觉有上百个出圈的机器人了。
我也想问一下冯博士和勉诺,人形机器人发展这么多年,本次的像美的、宇树、智元的人形机器人和早期的阿西莫和波士顿动力相比,到底有什么区别?
冯子勇:从我的角度来说,刚才也讲到,过去很多机器人的控制是以规则或者以硬编码为主。现在我们有了强化学习,有了VLA,可以把这个模型的训练融合到机器人里面。我们可以看到,随着数据的积累,机器人的能力会不停地提升。比起我们手写规则,它的上限会更高,效果也会更好。这是我从机器学习这个层面上去看到的。
赵仲夏: OK,然后勉诺是否能来表达一下,您觉得这次人形机器人和之前的有什么主要区别?
陈勉诺:我们也一直在关注具身领域的发展。我们看到波士顿动力早年的时候,其实以液压传动为主,今天的机器人大家都普遍用电动传动,这个是一个很大的本质区别,因为液压传动到电动传动能够在里面加入到很多新的智能算法。第二个点是以前大家是基于rule-base的方式去做控制学来实现机器人的运动,今天我们可以用 learning-base 的方式来去实现更多任务的泛发性,比如说可能在 manipulation 操作层面上带来一些新的可能性。
在今天,中国本土的供应链能力也得到了这个大幅的提升,所以在这一波的机器人浪潮里,中国的企业玩家越来越多,可以推导到当年的电动汽车领域。我们最开始电动汽车领域整个产业链也是相对落后的,但在整个的电动车领域发展之后,我们对于新的产业链有了巨大的技术提升。
赵仲夏: 您说得很对,之前大部分波士顿动力都是液压形式的,这次我们看到的几乎所有人机器人都是电机形式的,而中国在电机领域做了很多很多的技术储备,供应链的优势也很高。
下一个话题,我们在场馆里也看到,人形机器人有两类,全人形和轮式的人形机器人。奚老师,您觉得人形机器人一定要具备双足吗?