首页资讯

“AI”之眼,一场视觉智能的进化 | 2025 ITValue Summit前瞻WAIC现场版:AI落地指南系列

时间:2025-08-06 20:39 作者:就叫小新

“AI”之眼,一场视觉智能的进化 | 2025 ITValue Summit前瞻WAIC现场版:AI落地指南系列

WAIC 世界人工智能大会展会上熙熙攘攘,格灵深瞳CEO吴一洲发现会场比往年更热闹,现场的人和产品的画像更丰富,而且许多大公司展现出的AI单点应用深度也让人印象深刻。AI应用真正走进产业的脉络更为清晰了。

在钛媒体2025 ITValue Summit前瞻WAIC现场版:AI落地指南系列的直播中,吴一洲与钛媒体联合创始人刘湘明聚焦视觉智能的进化和AI技术升级下的技术厂商展开对话。

格灵深瞳一直深耕视觉算法和多模态大模型技术研发,经历过上一个技术时代的技术企业在这一波智能浪潮中有明显不同的感受——产品有了“成长性”。吴一洲在对话中反复强调的一点是:要让产品能用起来、用得好,而且有持续性的成长性。这不仅是格灵深瞳对产品的要求,也是作为技术厂商与客户共创的愿景。

“以前,我们会给客户一个通用工具,现在有了智能体Agent之后,变成了个性化、有记忆的工具,相当于一个搭档、一个执行合伙人,应用上更细化、更成熟了。”吴一洲介绍说,经过近几年的演进,格灵深瞳构建了由模型、算法、软硬一体的产品和服务形成的端到端的体系。不过,她仍然非常理性,认为当前AI距离真正的落地应用、在行业里跟专家超融合一样去深化应用,还有一段距离,这是在不断与客户共创的过程中得出的越发清晰的认知。

AI应用尚不成熟的局面,也给产品解决方案提供商带来一个挑战:过去按许可证(license)付费的逻辑,今天演变成了为效果、性能付费等等有待明确的标准。

“现在收费标准确实非常离散。现在主要面临三重困境:一是定价标准缺失,服务价值缺乏行业基准;二是商业模式模糊,介于基础设施、技术服务、产品工具以及咨询服务之和;三是双向预期偏差,客户对效果认知不统一,供应商服务成熟度待验证。这个问题本质是产业成熟度问题,需经历服务定价的帕累托优化过程。”吴一洲坦言,这是供需双方对最终把工具实际用起来、并且是可持续用起来,要付出的时间和成本预期能不能一致的认知问题。

AI时代变化不定,吴一洲更相信掌握技术的自主权,同时也保持与生态合作、互助互利的开放态度,在既有的金融、泛安防、政务、体育四大优势领域继续深耕。“硬件、数据采集以及持续优化、认知、服务、大规模部署、大规模算法升级、大规模调试的难点……”吴一洲坦言,“坑”其实是数不尽的,而且面向不同客户、不同场景的“坑”其实不太一样,“我们积累的经验是在一些特定的行业、场景里深耕下去,尽量跟客户一起少踩一些‘坑’,但其实没有捷径可走。”

附上本期直播时间轴,帮你快速跳转感兴趣的部分:

05:55 在赛道中跑出身位优势的关键

09:13 那些年踩过的“坑”

21:42 如何让能力基础不同的客户都跑起来?

28:34 市场、技术、客户不断变化,战略重点如何调整?

31:39 技术要自主,但界限在哪里?

34:25 收费、交付的挑战如何解决?

以下为对话实录,经笔者整理:

刘湘明:大家好,欢迎来到《数字价值观察室》在WAIC世界人工智能大会的现场。一洲,你这两天在大会有什么感受,有什么发现,跟大家分享一下。

吴一洲:第一个感受还是火爆,而且是多方位的。以前是深度参与AI产业的人关注这个大会,现在有各种年龄、各种职业、各种产业里的人都涌向了这个大会。大家都在观察有没有新的事物、新的应用、新的思想。

第二,明显感觉产品越来越丰富,更具象化了。从单纯关注模型、智能体,到现在我们看到了具身智能、企业级应用、个人助理,以及端到端的产品,能感觉出来大家在AI的这片土壤里长出了很多新鲜的事物,也给我们带来了很多的新想法。

我观察了一些大厂的成果,像头部科技企业展台(如阿里巴巴、蚂蚁集团)突破单纯AI模型展示,深度融合云计算与大数据时代的技术积淀。其中蚂蚁集团呈现的业务视角下的AI应用实践,为行业深度集成提供了一些重要参考。国家电网展区是展示AI与核心业务的深度融合范例,其在分拣机器人等硬件设备中实现原生级创新,印证“专家型转型”理念---即AI系统需与行业专家形成智能规划与决策层面的深度协同。此外,消费级AI硬件展区(以具身智能、AI眼镜为代表)直观呈现大模型技术的生活化应用路径,具有普适性示范价值。

刘湘明:回到主题,格灵深瞳一直在计算机视觉和大数据分析领域深耕了很多年。所以我也想请问一下,在这个赛道里面,现在跑出一些身位的优势,你觉得关键是什么?

吴一洲:我们只能说在某一些具体的场景下是有优势的,直白地说,现在谈优势还为时尚早。

我们是视觉、小模型CV算法起家,从2019年开始布局大模型,尤其是视觉大模型基座,这两年我们也推出了自己的Glint-MVT视觉基础模型。可以看到,我们其实一直在坚持布局AI视觉这部分,我们认为这是多模态以及人工智能应用中不可分割的一部分。AI不只有语言的部分,还有感知的部分,而且感知部分占比还是很高的。

在坚持这样一个主赛道的情况下,我们做了很多产品,我觉得真正在场景中有优势,还是要让产品能用起来、用得好,而且持续性的有成长性。原来工具类的产品每一次升级是靠新版本发布,但AI自身有一种迭代能力,不是单纯靠外界编程的。

在小模型时代,我们的迭代力是不够的。现在我们替换了自己的大模型、以及很多生态合作伙伴一起拥抱了大模型基座之后,明显能感受到冷启动的能力,以及自身每一次发布新版基座模型的时候,上面的算法本质上有了一次新的演变,我们能感觉到它自己有成长性了,就像一个孩子一样生长的力量。

可能谈得上一些优势的地方,是我们对于工程化、成本,以及过程中踩过的“坑”、怎么规避踩“坑”,还有对团队的配置、对事物的理解,我觉得是有经验的。

我们也构建了模型、算法、软硬一体的产品、服务这么一套端到端的体系。但是离真正的深化应用、在行业里跟专家超融合一样去深化应用,我觉得还是有一点进程的。

刘湘明:能不能跟大家分享一下踩了哪些“坑”?

吴一洲:抽象提炼来说,有以下几点。

当然,我们还面临大规模部署、大规模算法升级、大规模调试的难点……“坑”其实是数不尽的,而且不同客户、不同场景的“坑”其实不太一样。我们积累的经验是在一些特定的行业、场景里深耕下去,尽量跟客户一起少踩一些“坑”,但其实没有捷径可走。

刘湘明:这两年的技术的升级,给格灵深瞳的业务和布局带来哪些新的变化?

吴一洲:最大的变化其实还不在于我们自身,客户的变化是最大的。这两年,客户对全面拥抱AI的热忱是非常高昂的,带来了很多畅想。

我们跟以前的自己相比,对待新事物(发展预期)更有耐心了。赛道上、行业上没有大的变化,更多是从底座开始,在行业里去深化和多元化技术——从基础的模型到硬件,如何更好地嵌入到客户的业务流程使用中,如何让客户的个体化的使用感更强。以前,我们会给客户一个通用工具,现在有了智能体Agent之后,工具变成了个性化、有记忆的,相当于一个搭档、一个执行合伙人,应用上更细化、更成熟了。

第二个比较大的变化,我们以视觉起家,在拥抱当前非常明确的多模态趋势时,也做了很多调整:第一,我们要吸纳更多人才进来,现在的年轻人对大模型、智能体的接受程度、拥抱程度、热忱是非常高的。我们的团队在更加年轻化,我们也鼓励大家抱有充分开放的心态,热忱地拥抱各种各样的技术,核心还是得尝试。另外,对于我们做底层的同事们来说,他们一定要站在这个浪潮里面,当弄潮儿,不能过早地去评判。

所以,格灵深瞳既保持了在行业以及应用体系的稳定性和执着,同时也是更加开放。从人才、视觉技术、生态多维度,越来越广泛,这两年都是在以交朋友为主,建立朋友圈,也充分参与别人的朋友圈,充分地打开我们的开放性。

刘湘明:现在你们最重要的几个场景是什么呢?

吴一洲:第一大场景还是在金融;接下来还有泛安防,也是我们始终会坚持的场景;第三,政务场景,尤其是涉及到高安全领域的政务场景,我们会做较细的深耕;我们还一直在体育训练赛道持续地发布产品,保留在To C领域的触达。

刘湘明:金融这些年的应用、需求有什么变化?

吴一洲:金融客户对AI技术非常热忱,他们应该是较早系统性布局数据中心(IDC)基础设施,并在风控、营销及安保等核心场景持续投入资源开展技术验证的。当前大模型时代的关键转变在于:客户不再局限单一流程优化,而是提出更深层的跨领域融合需求。

例如,安保视频分析数据自然赋能风控决策体系,这种协同效应突破了传统信息化孤岛模式。其本质变革源于底层技术架构的统一化:基于大模型与智能体构建的公共基座,使原本分散的部门数据资产(虽仍保持权属独立)在应用层面实现无缝贯通。相较于大数据时代依赖人工连接“烟囱系统”的刻意整合,新范式通过统一技术基座促成业务部门视角转换——从关注系统建设归属转向聚焦使用价值,最终形成更自然的跨域协同机制。

刘湘明:不同的行业和企业,数字化的基础是差别非常大的,大模型的能力更是参差不齐。你们现在对能力基础不同的客户,怎么让他们都能够跑起来。

吴一洲:基础不一致,可以用不同的方式解决。对于基础非常好的客户,比如金融银行或者安防行业,很多时候客户给我们带来的启发更大,因为我们陪伴客户很多年了,会完全从客户的业务视角、从规划到落地的视角来去思考。很多时候,客户已经开始跟我们讨论更深层次的智能孪生、智能迭代的问题,比如,如何让采集行为本身具备智能,从采集到分析、决策支持整个闭环过程具备智能,带着规划演进、迭代升级。

但是,对于一些数字化基础较弱的行业或者客户,好处是他们可以跳过很多不必要的迭代过程,直接进入智能时代。

但核心还是认知问题,对于最终把工具实际用起来,并且是可持续用起来,要付出的时间跟成本是什么样子?本质在于大家对这个问题的预期能不能一致。

刘湘明:针对不同起点、不同基础的客户,你们的产品策略是什么样的?

吴一洲:针对前瞻型客户采用共创研发模式,将咨询环节纳入研发体系,重点突破行为数据与因果关系的采集瓶颈;面向入门级客户则提供直效型标准化产品,通过最小化使用成本建立初步价值认知,分阶段实现“可用→好用”的体验演进。这种策略既满足深度定制需求,也保障技术普惠可行性。

刘湘明:市场在变化,技术在变化,客户也在变化,格灵深瞳的战略重点会是什么样的?

吴一洲:有几个比较关键的要素。第一,技术跟进一定要牢牢地掌握在自己手里。所有技术的深入都是一块硬骨头,不管是我们自己的Glint- MVT视觉基础模型,还是未来要发布的多模态大模型。很多人也在问我,为什么已经有很多多模态大模型的情况下你们还要做一个?首先,这个模型肯定是有格灵深瞳的特点,比如在视频分析、垂直细分的工具、模型的精炼上一定是有我们自己特点的;第二,要跟进这个开放的时代,要知道怎么用、怎么去解决问题。“改一改就用了”跟“深入地自己完整走一遍这个过程”,带来的认知是不一样的,我们会走得非常扎实。相关工具也会慢慢多元化起来,而且我们会全面地开放给客户、开放给生态,互利互助。

第二,在前面提到的四个行业,已经足够我们端到端深耕了。把任何一个行业做好,都是非常非常难的。在我设想中,再过几年,在格灵深瞳的前端行业里,可能行业专家本身所占的比例会大幅度提升,并不是单纯使用AI能力的专家。不过,距离我们跟客户在行业里真正感知和用好技术,我觉得还有一段时间。

刘湘明:你刚才说了一个特别好的点,就是技术的跟进,怎么把技术掌握在自己手里边。但其实每个人理解的技术是不一样,这个界限你是划在哪?哪些是留给自己去做的,哪些可能合作伙伴去做,哪些可能是要那些大厂花上百亿去干的事情?

吴一洲:现在格局已经越来越明显了,决策框架基于三要素评估:资金规模、人才储备、时间成本。其实我们做视觉大模型也是跟大厂充分建立生态、互利互助的;第二,我们把自己最擅长的技术拿出来给大家用,比如今年下半年计划发布的视觉基础模型Glint- MVT的新版本,在视频分析处理和理解上(性能)比较好,因为我们在视频领域是要扎深的,这是主线;其他的,我觉得都是要靠生态,因为现在进入到深水区,每一件事情所要付出的成本以及实现难度都超乎想象。

刘湘明:如果按性能效果收费,交付的挑战因素有哪些?如何解决?

吴一洲:现在收费标准确实非常离散。现在主要面临三重困境:一是定价标准缺失,服务价值缺乏行业基准;二是商业模式模糊,介于基础设施服务与咨询公司形态之和;三是双向预期偏差,客户对效果认知不统一,供应商服务成熟度待验证。这个问题本质是产业成熟度问题,需经历服务定价的帕累托优化过程。

刘湘明:客户在AI落地时最紧迫、最重要的问题是什么?

吴一洲:关键痛点集中于两大维度:一是人才瓶颈维度,缺乏兼具决策能力与落地经验的复合型人才,理想状态是业务专家与AI专家的“双重属性融合”体现在同一个人身上;二是目标管理维度,对AI的预期目标多元且时效要求高,但落地过程中受到成本约束等因素影响,容易导致实际效果的波动,所以需要更聚焦、更纯粹地理解和解决项目的本质问题。根本解决方案在于培育AI原生思维,使技术应用成为业务决策的本能组成部分。

刘湘明:谢谢一洲,特别坦率而且非常有洞见的分享。


9月11日-14日由钛媒体集团、ITValue联合主办的2025 ITValue Summit 数字价值年会将以「AI落地场景真相」为主题,与新老朋友重聚三亚,并在全年围绕1场年度演讲,5大ToB明星IP持续内容“造血”,设计N个场景的想象空间,打造1本《AI落地场景指南》,一同解决AI实际落地应用背后的“10大问题”,探索数字经济时代的变革和机遇。(点击进入了解更多大会报名信息)
评!加入创新场景50榜单评选 2025年度「创新场景 TOP 50」榜单评选征集启动 申报日期:即日起~8月22日止 公开投票及专家评审:2025年8月23日起~8月31日止 申报链接:https://m.tmtpost.com/post/cj50(请使用PC端申报,暂不支持手机端)

Top

1、松延动力宣布已完成数亿元A++轮融资,松延堂创始人是谁

2、决胜“十四五” 打好收官战|路通人和!我国加速织就交通“经纬网”

3、暑期档电影总票房突破75亿元,暑期电影票房排行榜

小编推荐

当前文章:http://www.share.tuanjian7.cn/ZGY/detail/vwakjj.html

相关阅读

网友评论

我要评论

发表
取消

就叫小新