开源🚀 基于美团LongCat-Video 13.6B - MIT许可证!

LongCat-Video: 下一代AI视频生成器模型

LongCat-Video: 一个开源AI,可以从文本或图像创建视频,并继续现有视频(文本生成视频、图片生成视频和视频续写任务)。

试用LongCat-Video实时演示

实时体验LongCat-Video的强大功能。从文本或图像生成视频,看到惊人的结果。

Loading LongCat-Video demo...

什么是LongCat-Video

LongCat-Video是美团推出的136亿参数基础视频生成模型。它具有统一架构,在单个模型内支持文本生成视频、图片生成视频和视频续写任务。LongCat-Video原生支持长视频生成,可产生分钟级视频而无色彩漂移或质量退化,使用粗到细生成策略高效生成720p 30fps视频。

  • 文本生成视频
    使用先进神经网络将文本提示转换为高质量视频。从简单文本描述创建引人入胜的视觉内容。
  • 图片生成视频
    通过生成流畅的视频动画让静态图像栩栩如生。通过智能运动合成从单张图像创建动态内容。
  • 视频续写
    无缝扩展现有视频而不会质量损失或色彩漂移。生成分钟级视频,具有一致的质量和自然的过渡。

模型对比

将LongCat-Video与其他最先进的视频生成模型在不同任务和指标上进行比较。

文本生成视频性能

模型可访问性架构参数文本对齐视觉质量运动质量总体质量
Veo3专有--3.993.233.863.48
PixVerse-V5专有--3.813.133.813.36
Wan 2.2-T2V-A14B开源MoE28B (14B Active)3.703.263.783.35
LongCat-Video开源Dense13.6B3.763.253.743.38

图片生成视频性能

模型可访问性架构参数图像对齐文本对齐视觉质量运动质量总体质量
Seedance 1.0专有--4.123.703.223.773.35
Hailuo-02专有--4.183.853.183.803.27
Wan 2.2-I2V-A14B开源MoE28B (14B Active)4.183.333.233.793.26
LongCat-Video开源Dense13.6B4.043.493.273.593.17
快速上手

快速开始

按照以下步骤快速上手LongCat-Video,几分钟内即可开始生成视频。

bash
#facc15;">"color: #4ade80;">git "color: #4ade80;">clone https://github.com/meituan-longcat/LongCat-Video."color: #4ade80;">git
cd LongCat-Video

LongCat-Video核心功能

为全球创作者和开发者设计的先进AI驱动视频生成能力。

统一多任务框架

单一模型支持文本生成视频、图片生成视频和视频续写任务,在所有生成模式下保持一致的高性能。

长视频生成

在视频续写任务上原生预训练,可产生分钟级视频而无色彩漂移或质量退化。

高质量输出

使用先进神经网络架构和优化技术生成专业质量的720p、30fps视频。

高效推理

使用沿时间和空间轴的粗到细生成策略和GPU加速,在几分钟内快速生成视频。

强大性能

由多奖励GRPO优化驱动,实现与领先开源和商业视频生成模型相当的性能。

开源和MIT许可证

完全开源模型,MIT许可证,可在GitHub和Hugging Face上获取,用于研究和商业应用。

人们在X上对LongCat-Video的讨论

加入社交媒体上关于LongCat-Video的对话

常见问题