Tensor.Art
在线生图

HunYuanDiT

CHECKPOINT
原创

11K

混元DiT,一个基于Diffusiontransformer的文本到图像生成模型,此模型具有中英文细粒度理解能力。为了构建混元DiT,精心设计了Transformer结构、文本编码器和位置编码。构建了完整的数据管道,用于更新和评估数据,为模型优化迭代提供帮助。为了实现细粒度的文本理解,训练了多模态大语言模型来优化图像的文本描述。最终,混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。

版本详情

HunYuanDiT

项目权限

    使用权限

  • 使用时无需注明出处

  • 用于模型融合

  • 分享融合模型时使用不同的许可

    商用许可

  • 生成的图片用于商业用途

  • 作为图片生成服务来商用

  • 转售模型或出售融合模型

评论

相关帖子

描述想生成的画面,回车发送