
在8月5日的房屋中,阿里巴巴Tgyyi Qianwen团队今天宣布了开放资源QWEN-IMAGE,这是20B MMDIT的型号,也是Thyi Qianwen系列中的第一个主要图像生成模型,在复杂的文本渲染和准确的图像编辑中,它在复杂的文本渲染和准确的图像中实现了重大发展。 QWEN图像的主要功能包括:文本渲染能力:QWEN-IMAGE很好地发挥了复杂的文本渲染,支持多行布局,段落级别的生成和渲染详细信息。在英语和中文中,都可以实现高保真的产出。图像编辑能力:通过增强的多任务训练范式,QWEN图像可以保持编辑过程中编辑的一致性。跨基准性能:审查许多公共基准测试表明,Theqwen-Image在各种任务和编辑任务中都会获得SOTA。 Tgyyi Qianwen团队对许多公共基准进行了全面的QWEN图像审查,包括Geneval,DPG和Oneig Bench of Universal I法师生成以及GEDIT,IMGEDIT和GSO进行图像编辑。 Qwen-Image在所有基准测试中都取得了最先进的性能。此外,用于文本渲染的LongText基础,中文单词和文本Craft的结果表明,Qwen-Image主要用于文本渲染,尤其是在中文文本中,这是在现有的最新模型中。 IT House中包括以下示例:宫崎骏的动漫风格。从平坦的角度拍摄,当天的古老街道还活着。一个小小的宗派,搭配一条蓝色衬衫的部分,并在这里写着一张纸牌,手里拿着“ Aliyun”一词。他旁边的两个孩子惊讶地看着他。左边有一家商店,这里有一个“云存储”标志,这里有一个发光的服务器盒,门口有两个监护人。右边有两家商店,其中一个有“云计算”的迹象,一个穿着Cheongsam的美丽女人看着内部发光的电脑屏幕;另一家商店的标志是“云模型”,并用“ Qianwen”写的一罐葡萄酒放在门上,一位老板女士在此处倾注了一份发光的解决方案。大厅悬挂着优雅而庄严的对联。房间是一种安静而古典的中国风格布局。桌子上有一些蓝色和白色瓷器。对联的左写着:“ Orihinal世代的含义意识到人类和机器的意思,同样的方式可以思考新的含义”,而正确的含义是:“云和智慧受到了启发,宇宙启发了,雄心勃勃,雄心勃勃,远处是遥不可及”,水平的旗帜是智慧和含义是启发性和含义的融合,并与中国风格相处,并伴随着一件悬而未决的地方,而这是一件悬而未决的地方,而这是一件上层的悬挂。 “ QWEN”徽标带有黑色脸部拍摄。ES复杂文本渲染和准确的图像编辑。除文本处理外,Qwen-Image还支持图像整体一代中的不同艺术风格。从现实的照片级场景到印象派的绘画,从动漫风格到简约的设计,模型可以轻松地响应各种创意技巧。在图像编辑方面,QWEN图像支持样式,加法和删除,详细信息增强,文本编辑,角色维修和其他操作的转移。它允许普通用户实现专业水平的图像编辑。其房屋的开源如下:ModelsCope:https://modelscope.cn/models/qwen/qwen/qwen-rigagehugging face:https://huggingface.co/qwen/qwen/qwen-imagegithub:https:https:https:https:https:https:https:/github.com.com:/github.com/qwenl/qwenl/qwenical-qwenical corlical reform https://qianwen-res.oss-cn-beijing.aliyuns.com/qwen- image/qwen_image.pdfdemo:https://modelscope.cn/aigc/imagegc/imagegeneration?tab = advanced