时间:2025-08-14 22:30 作者:斗战天
昆仑万维举办AI技术发布周 展示多模态AI领域突破性成果
8月11日至8月15日,昆仑万维(300418)举办覆盖五大技术领域的SkyWork AI技术发布周,每天发布一款模型,包括视频生成模型Skyreels-A3、世界模型Matrix-Game-2.0和Matrix-3D、生图一体化模型Skywork UniPic2.0、智能体(Skywork Deep Eesearch Agent)模型等,全面展示昆仑万维在多模态AI领域的突破性成果。
本次技术发布周的举办,标志着昆仑万维AI技术全面迭代,AI产品迈入商业化应用阶段。昆仑万维正凭借其技术储备与商业前瞻性,加速迈入应用落地与商业化加速的高速增长阶段。
Skywork Deep Research Agent v2 正式发布
8月14日,昆仑万维正式发布Skywork Deep Research Agent v2,它是天工超级智能体(Skywork Super Agents)的核心引擎。
Skywork Deep Research Agent自5月22日上线后,大幅重塑了大模型在AI Office领域的角色,通过skywork.ai平台为用户产出了大量信息密度极高的优质文档、PPT、表格以及其他交付物。
图丨昆仑万维Skywork Deep Research Agent v2宣传图
据了解,当前业界的Deep Research Agent产品都是采用搜索并抓取网页文字信息的方式实现,依赖于纯文本检索分析,而互联网上超过一半的关键信息来自图文混排:财报中的曲线、论文里的实验图、社媒上的对比照、方案里的流程图……这些多模态信息一旦被忽略,代表着Agent将会丢失大量决策依据,将直接影响Agent产出的交付物质量。
“为解决这一痛点,公司的Skywork团队推出了业界首个‘多模态深度调研’Agent,首次将多模态检索理解和跨模态生成能力完整整合到深度研究工作里。”昆仑万维方面介绍,为实现多模态信息检索这一能力的提升,昆仑万维Skywork团队在四个方面完成技术突破:多模态爬取技术MM-Crawler、长距离多模态信息收集、异步并行 Multi-Agent多模态理解架构和多模态结果呈现能力。
通过以上技术创新,多模态Skywork Deep Research Agent v2把“读文字+看图片”这件看似简单却长期被忽视的事情真正做到位,让研究人员等用户一次拿到信息完整、节奏顺畅、视觉友好的深度报告。
需要指出的是,为了进一步加强Agent基础模型的复杂任务执行和信息检索、整理、总结能力,Skywork Deep Research Agent v2引入了多种提升机制,包括高质量数据合成及训练、端到端强化学习、高效的并行推理,以及多智能体自我学习演进系统。新版本的Skywork Deep Research在多项Agent任务评测上超越现有模型,达到行业SOTA水平。
在权威的搜索评测榜单BrowseComp上,Skywork Deep Research的表现尤为突出。常规模式下,其性能已超越大多数同类产品,正确率达到27.8%。而一旦开启自主研发的“并行思考”(Parallel Thinking)模式,正确率更是跃升至38.7%,刷新了行业SOTA纪录。
图丨昆仑万维Skywork Deep Research Agent v2宣传图
据昆仑万维介绍,为了进一步解锁Agent的能力边界,Skywork下一代多智能体系统将深度挖掘不同Agent模型的差异化优势,并将其模型能力与工具能力有机融合,构建协同多智能体框架。该系统不仅能够将多个Agent组织成高效协作团队,还可在线实时利用Agent的代码能力动态创建和管理MCP工具,从而显著提升任务处理能力与环境适应性。
一周连续发布多款模型
在此之前,昆仑万维8月11日正式发布SkyReels-A3模型,基于“DiT(Diffusion Transformer)视频扩散模型+插帧模型进行视频延展+基于强化学习的动作优化+运镜可控”,其能实现任意时长的全模态音频驱动数字人创作。SkyReels-A3正在把“让影像随声而动”这件事变成人人可上手操作的工具:不需要专业影棚、不需要昂贵设备,只要一段声音和一张照片,人人都能创造无限时长、无限可能的数字内容。
图丨昆仑万维SkyReels-A3宣传视频截图
紧接着,昆仑万维又在8月12日带来了自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——「Matrix-Game 2.0」,同样实现了通用场景下的交互式实时长序列生成的世界模型。据了解,为促进交互式世界模型领域的发展,「Matrix-Game 2.0」全面开源,这也是业内首个在通用场景上实现实时长序列交互式生成的世界模型开源方案。
除了持续推进当前的视频生成等核心技术,昆仑万维也在积极布局AI发展的下一阶段。即通过空间智能实现对三维世界的深度理解与生成。现有方法依赖多视图输入和局部视角渲染,难以从单张图像生成结构完整、可探索的3D世界。8月12日,昆仑万维还推出Matrix-3D——一个融合全景视频生成与三维重建的统一框架。它从单图像出发,生成高质量、轨迹一致的全景视频,并直接还原可漫游的三维空间,对标李飞飞World Labs的生成效果,可实现更大范围的探索空间。
图丨昆仑万维Matrix-Game-2.0宣传图
“当前,「Skywork UniPic 2.0」及其系列模型已全面开源,涵盖模型权重、推理代码、强化策略等,助力开发者与研究者快速上手并构建多模态应用。”8月13日,昆仑万维正式开源「Skywork UniPic 2.0」模型——面向统一多模态建模的高效训练和推理框架,围绕生成和编辑模块轻量化、连接多模态理解模型进行联合训练,构建了理解、生图、编辑一体化的核心能力,旨在实现“高效、高质、统一”的多模态生成模型。
图丨昆仑万维Skywork UniPic 2.0宣传图
昆仑万维在统一模型领域持续深耕,在开源Skywork UniPic 1之后,从头训练自回归范式的统一模型。开源「Skywork UniPic 2.0」,将DIT和自回归范式结合在一起。
据介绍,升级后的「Skywork UniPic 2.0」具备三大核心优势。首先,生成模块轻量高效,性能拉满。生成模块基于2B参数的SD3.5-Medium架构训练,生图和编辑指标超越生成模块具有7B参数的bagel,4B参数的OmniGen2,12B参数的UniWorld-V1和Flux-kontext模型。其次,引入强化学习,效果显著。基于Flow-GRPO首创渐进式双任务强化策略,有效提升模型对复杂指令的理解能力与图像生成和编辑的一致性,两大任务协同优化、互不干扰。最后,可以一体化灵活切换,拓展能力更强。将生图编辑的Kontext模型与多模态模型端到端整合,微调轻量连接器,即可快速构建统一理解—生成—编辑模型,并且生图和编辑的性能进一步提升。
整体AI技术实力稳居行业第一梯队
昆仑万维作为中国领先的人工智能科技公司,近年来在AI大模型、AI搜索、AI短剧、AI音乐、AI游戏、AI社交等多个领域取得了显著进展,构建了全面的AI业务布局。在AI大模型方面,公司通过自研技术持续迭代“天工”系列大模型,在复杂任务处理、多模态等方面实现多项突破,整体AI技术实力稳居行业第一梯队。
值得一提的是,昆仑万维作为人工智能领域的创新引领者,其在过去数月内持续多次迭代大模型版本,以视频生成模型SkyReels为例,2025年2月发布了中国首个面向AI短剧创作的SkyReels-V1版,2025年4月发布了全球首个使用扩散强迫框架的无限时长电影生成模型SkyReels-V2版,本次又发布了音频驱动(audio-driven)人像视频生成模型SkyReels-A3版,不断突破AI技术边界。
在多模态领域,昆仑万维不仅推出了将文本推理能力迁移至视觉的多模态推理模型「Skywork-R1V」系列,以38B的轻量级规模性能媲美闭源的大参数模型。同时昆仑万维也前瞻性地布局了空间智能领域,推出了交互世界模型「Matrix-Game 2.0」与3D世界生成模型「Matrix-3D」。
针对数学代码等专业领域,也推出了文本推理模型「Skywork-OR1」,在同等参数规模下实现了业界领先的推理性能,软件工程自主代码智能体基座模型「Skywork-SWE」也是在开源的32B模型规模下实现了业界最强的仓库级代码修复能力。
AGI与AIGC业务商业化取得重要进展
2024年,昆仑万维实现营业总收入56.6亿元,同比增长15.2%,整体毛利率达73.6%,继续保持在较高水平。公司进一步开拓海外市场,收入继续保持积极增长态势。其中,海外信息分发与元宇宙平台Opera继续保持高速增长,2024年实现营业收入4.8亿美元,同比增长21.1%;海外社交网络和短剧平台业务实现营业收入12.5亿元,同比增长28.5%,综合推动公司海外业务收入规模至51.5亿元,同比增长21.9%,占总收入比重达91.0%,为多元化AI产品矩阵的拓展奠定了坚实基础。
据昆仑万维2024年年报介绍,公司继续坚定践行“All in AGI与AIGC”发展战略,持续加大研发投入,全年公司研发费用为15.4亿元,同比增长59.5%。公司AGI与AIGC业务商业化取得重要进展。AI社交报告期内单月最高收入突破100万美元,成为海外收入增长速度最快的中国AI应用之一。
2025年第一季度,昆仑万维以创新为引擎,在全球人工智能领域实现多项里程碑式突破,持续巩固行业领先地位。公司在多模态推理、视频生成、音频生成等关键方向,推出多项颠覆性技术与开源成果,为数字内容生产、智能决策及产业生态升级注入全新动能,彰显中国AI企业的技术自信与全球视野。
2025年第一季度,公司实现营业收入17.6亿元,同比增长46.1%,AI音乐年化流水收入ARR达到约1200万美金(月流水收入约100万美元);短剧平台Dramawave 年化流水收入ARR达到约1.2亿美金(月流水收入约1000万美元),为收入增长注入强劲动力。公司全球化战略成效显著,实现海外业务收入16.7亿元,同比增长56.1%,海外业务收入占比提升至94.4%,国际化布局进一步深化。
昆仑万维Skywork AI技术发布周每一项技术创新,都与当前产业肌理充分融合。这不仅是一次前沿技术的集中秀场,更是昆仑万维从前期研发重投入转向技术商业化的标志。从单点领先到生态赋能,昆仑万维的商业化效率与全球化布局能力都在今年取得重大突破,这意味着昆仑万维正在跑通规模化盈利路径。
责编:彭勃
校对:赵燕
1、“量升利降”怪圈难破,正极材料行业洗牌,德方纳米等如何破局?
2、印度这样的才能高效合成完全的蛋白,中国主食很多是空卡路里,印度蛋白质摄入
3、深度解读:日本侵华五十年(1894-1945)之四,日本侵华路线及时间