
根据8月5日的Kuai Technology,今年清晨,阿里巴巴Thyi Qianwen宣布了开放资源Qwen-Image,这是20B MMDIT的型号。这是Thyi Qianwen系列中的第一个主要图像生成模型,该模型已在复杂的文本渲染和准确的图像编辑中进行了重大发展。据了解,该模型着重于在两种基本情况下提高AI的功能:复杂的文本渲染和准确的图像编辑。功能亮点:功能强大的文本渲染功能(开放资源)会带来效果:在许多文本评论列表中,文本渲染赢得了SOTA。本机渲染:当图像的产生而不是稍后添加时,文本是直接输出,效果更现实。综合功能:支持的chinese和英语双语,可变字体,额外的段落和超小文本,并且可以实现复杂的图形布局布局。坚实的基础:除文本外,该模型也与角色情绪,详细的照片和不同的渲染样式形成良好的形式。准确的图像编辑功能(尽快发布)稳定效果:多图像编辑SOTA编辑评论列表。链编辑:经过许多持续更改后,仍然可以保持ID主题的一致性。文本编辑:您可以在图像中编辑文本。复杂的编辑:编辑的角色姿势,图像纹理等。TalyiQianwen全面研究了许多公共基准的Qwen-Image,包括Geneval,DPG和Oneig Bench,用于整个Imimage,以及GEDIT,IMGEDIT和GSO的整体生成图像编辑。 Qwen-图像在所有基准测试中都达到了最先进的性能,显示了其在图像生成和图像编辑中的强大功能。此外,在longText基础,中文文字和文本渲染文本中的结果表明,qwen图像主要用于文本渲染,尤其是在渲染中文文本中,这是较早存在的最先进的模型。除文本处理外,QWEN-IMAGE还在图像的整体一代中表现出色,这支持了各种艺术风格。在图像编辑方面,QWEN-IMAGE支持各种操作,例如转移样式,加法和删除,细节增强,文本编辑和调整角色姿势,从而易于实现普通用户审核专业图像编辑。 [本文的结尾]如果您需要打印,请确保指示来源:Kuai技术编辑:Shiqi