通义千问推出系列中首个图像生成基础模型Qwen-Image

时间：2025-08-05 23:47　作者：无能的王

通义千问推出系列中首个图像生成基础模型Qwen-Image

通义千问发布了首个开源图像生成基础模型Qwen-Image，Qwen-Image是一个200亿参数的MMDiT模型，是通义千问系列中首个图像生成基础模型。

该模型在文本渲染方面表现卓越，支持中英文多行段落级高保真文本渲染，对复杂场景和细粒度细节处理能力强。Qwen-Image具备一致性的图像编辑能力，通过增强的多任务训练范式，在编辑过程中能保持内容的一致性。

在GenEval、DPG、OneIG-Bench、GEdit、ImgEdit、GSO等多个公开基准测试中，Qwen-Image均取得了最先进（SOTA）的性能。特别是在LongText-Bench、ChineseWord和TextCraft等文本渲染基准上，Qwen-Image表现突出，尤其是在中文文本渲染方面大幅领先现有模型。Qwen-Image能够准确渲染海报、PPT页面等多种包含复杂文本和图像组合的场景。

Top

1、王峤：达到里程碑是荣幸也是对我坚持的最好诠释

2、米兰市长萨拉：圣西罗球场未来将走向出售，需市议会批准,ac米兰圣西罗

3、我是四川的，我这儿太阳多，但是不闷热，路边就是水果，掉地上也没人吃

小编推荐

当前文章：http://www.share.tuanjian7.cn/JXZ/detail/ewyfgj.html

相关阅读

施一公亲自打电话后，677分同学放弃北大改报西湖大学，如何看待他的选择？

也谈怎么做茄子菜,怎么做茄子菜好吃

SIA：2025年第二季度全球半导体销售额同比增长近20%

酷似大S走红女生删除视频：你们要火自己火去吧，别烦我了,大s像谁

给《灵笼》主创报了个辅导班，这次溯源之旅太涨知识了（新视角）,灵笼介绍

全球科技大厂狂砸AI钱！英伟达供应商胜宏赴港要接红利？,英伟达在中国的营收

遵义会议的背后，是绵延十几年的斗争,遵义会议意味着什么

30 个销售阻击小米 YU7 的话术

于和伟要演毛主席？年龄大了点，多久没看到真正的“特型演员”了

相关ETF持续吸金，“红利+科技”策略为何奏效？

南宋张俊墓的研究系列1 ——无锡地方志中的一些疑问

AI教育风口下，有人乘风破浪，有人艰难求生,ai教育项目

情绪翻车现场：谁在幕后操控我的心情遥控器？（情绪ABC大揭秘）,情绪调控abcde

为什么说武大图书馆案的判决书经得起考验？,武大图书馆总馆在哪个学部

又干了一件蠢事，心里不是滋味,干了一件蠢事心里很尴尬怎么办

阿里巴巴启动2026秋季校招，超六成为AI相关岗位,阿里巴巴2020校园招聘会行程

数据污染冲击安全防线，国安部：警惕人工智能“数据投毒”

王贻芳院士：AI虽能取代很多人，但无法取代最聪明的人，肯定做不了最顶级的物理学家

回应禁赛！泰山晒上赛季亚冠3-1光州照片：所有的坎坷都会过去,山东泰山2021亚冠

武工队的机枪手骑毛驴,武工队的武器

“富有成效的巴中合作彰显金砖机制活力”

满世界宣扬“不可思议的印度”的印度政府和媒体，这一次被美国财长真的惹毛了

马斯克的“美国党”没消息了？

“我就想告诉下一代人：历史，是不能被忘记的。”

深度 | 陈金英：为什么说莫迪和印右翼势力正给印国家发展“埋大坑”？

为什么现在社会的中年男人都喜欢年轻女孩？,中年男人都喜欢年轻女孩吗

成为脊髓损伤患者后，我的生活基本上就在医院——家庭之间来回,脊髓损伤未来有望突破吗

央行等七部门联合印发《关于金融支持新型工业化的指导意见》

淘宝即将上线大会员体系：打通饿了么、飞猪、盒马,淘宝的大会员为什么这么便宜

纽约开LAB店，硅谷排长队，喜茶在欧美开打“高端局”

守护可可西里｜原来，你是这样的可可西里！,可可西里保护者

中手游旗下满天星工作室总经理姜某某因职务犯罪被刑拘,满天星团队每日收入是真的吗

网友评论

我要评论