时间:2025-08-13 05:44 作者:墨涵墨涵
对话博登智能赵捷:工业级的“数据炼金师”有多重要?
(文/张志峰 编辑/周远方)
从支撑自动驾驶的算法进化,到助力具身智能的技术突破,博登智能的实践,正是中国AI企业以数据为基石、破解产业难题的典型代表。
“AI的突破离不开高质量数据支撑,而当时国内缺少专业化、工业级的数据处理服务商。”赵捷博士向观察者网表示,2019年,当自动驾驶、大语言模型等技术加速落地时,他敏锐地察觉到行业痛点:数据供给仍停留在“手工作坊”阶段,难以满足AI模型对规模化、高精度数据的需求。
博登智能的解决方案,是将数据处理升级为“智能流水线”。其自主研发的多模态数据标注大模型,能够同时处理文本、图像、音频、视频等多模态的复杂数据,广泛应用于自动驾驶、智慧医疗、智慧教育等场景。
赵捷博士强调:“无论是虚拟世界的语言模型,还是物理世界的人形机器人,都需要我们从数据根基上筑牢创新之路。”他将公司定位为“数据炼金师”,旨在通过技术创新提炼数据的“纯度”与“价值”。
目前,博登智能已在北上广及香港设立子公司,服务对象涵盖汽车主机厂、自动驾驶企业及腾讯、阿里等AGI研发公司。Meta收购Scale AI的案例进一步印证了他的判断:“当AI进入落地阶段,数据质量已成为AI发展的关键壁垒。”
此外,赵捷博士还提到,硅谷已有三家由华人创建的数据公司,如Surge AI等,去年营收接近10亿美金,“这说明美国在高质量语料库建设方面非常重视,我们也意识到这是一个很好的机会,今年在这一领域的进步尤为显著。”
面对这一难题,赵捷博士提出可借鉴自动驾驶的发展经验。他指出,自动驾驶发展早期面临长尾效应问题,很多corner case(极端场景)在真实场景中难以获取,“比如在下雨天捕捉到行人横穿马路时发生车祸的场景,可能采集10次、100次都不一定能采集到。”
对此,行业采用了基于虚拟场景的合成数据方式来解决。“先在真实场景中建立3D物理环境模型,再通过算法处理,模拟出想要的前景,如人物、车辆等,以此模拟不太常见的corner case。”
对于人形机器人何时能够进入千家万户,赵捷博士参考了智能驾驶的发展历程进行分析:“激光雷达成本从10万美金降到几千人民币,推动了智能驾驶的普及。人形机器人也是如此,等供应链成本降低到大众可承受的范围时,就能逐步进入千家万户,我非常期待这一天的到来。”
在数据安全与治理方面,赵捷博士认为,可以在早期数据集建立中设置规范和规则,屏蔽不具有主流价值观的数据,并在模型测试和使用阶段加强检测与评判,通过有效的数据和模型迭代,降低模型在使用过程中表现出不符合主流价值观及各种安全性问题的风险。
对比中美在数据生态上的差异,赵捷博士指出:“在大语言模型发展上,美国确实起步较早,但近一两年,尤其去年下半年开始,中国的大语言模型公司也在加大投入,差距正在快速缩小。”
1、刺激消费,刺激经济提速,中国需要更多的低密度社区,更多的别墅社区
2、养老领域非法集资犯罪多发,公安部公布5起典型案例,养老领域的非法集资
3、弗兰克:休赛期更长肯定会有优势;现在就是对阵巴黎的好时机,弗兰克篮球