新模型简介:腾讯混元文生视频模型新尝试


更新

腾讯混元文生视频模型

HunyuanVideo,这是一种新颖的开源视频基础模型,它在视频生成方面的性能与领先的闭源模型相当,甚至优于后者。

混元视频模型,采用了几种关键的模型学习技术,包括数据管理、图像-视频联合模型训练和高效的基础设施,以促进大规模的模型训练和推理。

此外,通过有效的模型架构和数据集缩放策略,成功地训练了一个具有超过130亿个参数的视频生成模型,使其成为所有开源模型中最大的。

该模型的设计,为确保高视觉质量,运动多样性,文本视频对齐和生成稳定性。有专业的人类评估,混元视频超越了之前最先进的模型,包括Runway Gen-3, Luma 1.6,以及3个表现最好的中国视频生成模型。

通过发布基础模型及其应用的代码和权重,弥合了闭源和开源视频基础模型之间的差距。这一举措将使文生视频开源社区的每个人都能尝试自己的想法,从而形成一个更有活力的视频生成生态系统。

这是我测试的一段科幻视频,真的很棒。

https://fal.ai/models/fal-ai/hunyuan-video?share=a20205ee-1949-4a52-8a30-b0728f992e79

2
0