LongCat-Video: Modelo Generador de Video con IA de Nueva Generación
LongCat-Video: una IA de código abierto que crea videos desde texto o imágenes, y continúa videos existentes (tareas de Texto a Video, Imagen a Video y Continuación de Video).
Prueba el Demo en Vivo de LongCat-Video
Experimenta el poder de LongCat-Video en tiempo real. Genera videos desde texto o imágenes y mira los resultados increíbles.
Loading LongCat-Video demo...
Qué es LongCat-Video
LongCat-Video es un modelo de generación de video fundacional de Meituan con 13.6B parámetros. Cuenta con una arquitectura unificada que soporta tareas de Texto a Video, Imagen a Video y Continuación de Video dentro de un solo modelo. LongCat-Video soporta nativamente la generación de videos largos, produciendo videos de minutos de duración sin deriva de color o degradación de calidad, y genera videos de 720p 30fps eficientemente usando estrategia de generación de grueso a fino.
- Generación de Texto a VideoTransforma prompts de texto en videos de alta calidad con redes neuronales avanzadas. Crea contenido visual atractivo desde descripciones de texto simples.
- Generación de Imagen a VideoDa vida a imágenes estáticas generando animaciones de video suaves. Crea contenido dinámico desde imágenes individuales con síntesis de movimiento inteligente.
- Continuación de VideoExtiende videos existentes sin problemas sin pérdida de calidad o deriva de color. Genera videos de minutos de duración con calidad consistente y transiciones naturales.
Comparación de Modelos
Compara LongCat-Video con otros modelos de generación de video de vanguardia a través de diferentes tareas y métricas.
Rendimiento de Texto a Video
| Modelo | Accesibilidad | Arquitectura | Parámetros | Alineación de Texto | Calidad Visual | Calidad de Movimiento | Calidad General |
|---|---|---|---|---|---|---|---|
| Veo3 | Propietario | - | - | 3.99 | 3.23 | 3.86 | 3.48 |
| PixVerse-V5 | Propietario | - | - | 3.81 | 3.13 | 3.81 | 3.36 |
| Wan 2.2-T2V-A14B | Código Abierto | MoE | 28B (14B Activo) | 3.70 | 3.26 | 3.78 | 3.35 |
| LongCat-Video | Código Abierto | Denso | 13.6B | 3.76 | 3.25 | 3.74 | 3.38 |
Rendimiento de Imagen a Video
| Modelo | Accesibilidad | Arquitectura | Parámetros | Alineación de Imagen | Alineación de Texto | Calidad Visual | Calidad de Movimiento | Calidad General |
|---|---|---|---|---|---|---|---|---|
| Seedance 1.0 | Propietario | - | - | 4.12 | 3.70 | 3.22 | 3.77 | 3.35 |
| Hailuo-02 | Propietario | - | - | 4.18 | 3.85 | 3.18 | 3.80 | 3.27 |
| Wan 2.2-I2V-A14B | Código Abierto | MoE | 28B (14B Activo) | 4.18 | 3.33 | 3.23 | 3.79 | 3.26 |
| LongCat-Video | Código Abierto | Denso | 13.6B | 4.04 | 3.49 | 3.27 | 3.59 | 3.17 |
Inicio Rápido
Siga estos pasos para configurar LongCat-Video y comenzar a generar videos en minutos.
#facc15;">"color: #4ade80;">git "color: #4ade80;">clone https://github.com/meituan-longcat/LongCat-Video."color: #4ade80;">git
cd LongCat-VideoCaracterísticas Clave de LongCat-Video
Capacidades avanzadas de generación de video potenciadas por IA diseñadas para creadores y desarrolladores en todo el mundo.
Marco Unificado Multi-tarea
Modelo único que soporta tareas de Texto a Video, Imagen a Video y Continuación de Video con alto rendimiento consistente en todos los modos de generación.
Generación de Video Largo
Nativamente pre-entrenado en tareas de Continuación de Video para producir videos de minutos de duración sin deriva de color o degradación de calidad.
Salida de Alta Calidad
Genera videos de 720p, 30fps con calidad profesional usando arquitectura de red neuronal avanzada y técnicas de optimización.
Inferencia Eficiente
Generación rápida de video en minutos usando estrategia de generación de grueso a fino a lo largo de ejes temporales y espaciales con aceleración GPU.
Rendimiento Fuerte
Potenciado por optimización GRPO multi-recompensa logrando rendimiento comparable a modelos líderes de generación de video de código abierto y comerciales.
Código Abierto y Licencia MIT
Modelo completamente de código abierto con licencia MIT disponible en GitHub y Hugging Face para aplicaciones de investigación y comerciales.
De Lo Que La Gente Está Hablando Sobre LongCat-Video en X
Únete a la conversación sobre LongCat-Video en redes sociales
🚀 LongCat-Video Now Open-Source: Text/Image-to-Video + Video Continuation in One Model
— Meituan LongCat (@Meituan_LongCat) October 25, 2025
🏆 Text/Image-to-Video Performance Hits Open-Source SOTA
🎬 Minutes-Long High-Quality Videos: No Color Drift/Quality Loss (Industry-Standout)
⚙ 13.6B Params | Strong Open-Source DiT-Based… pic.twitter.com/rJXv7DiVZx
Chinese doordash dropping MIT license foundation video models???
— Vaibhav (VB) Srivastav (@reach_vb) October 25, 2025
“We introduce LongCat-Video, a foundational video generation model with 13.6B parameters, delivering strong performance across Text-to-Video, Image-to-Video, and Video-Continuation generation tasks.”…
🐈✨✨✨ #VRChat #まめひなた
— ティキレス (@VRTikiRes) December 29, 2023
ワールド名 Longcat Challenge ǃ https://t.co/FSGoEMgCUM pic.twitter.com/7TdIRdy94M
🇨🇳 Chinese doordash Meituan launched LongCat-Video on @huggingface under MIT License.
— Rohan Paul (@rohanpaul_ai) October 25, 2025
A small 13.6B model that unifies Text-to-Video, Image-to-Video, and Video-Continuation, targeting minutes-long coherent clips and fast 720p 30fps output.
It frames every task as continuing… pic.twitter.com/Q0b71C2VWA
🎡📸
— n 🐹🪻 (@hasumikn) September 29, 2024
(cr: longcat • crepe) pic.twitter.com/h1NTxKMxzJ
Congrats to @Meituan_LongCat on achieving extremely low cost and fast generation speed for LongCat-Flash —powered by SGLang,FlashInfer kernels and #opensource innovation.
— NVIDIA AI Developer (@NVIDIAAIDev) September 8, 2025
We are excited to continue collaborating with @lmsysorg and the community to upstream optimizations. Read… https://t.co/M1wGVgR2No
🎉 Congrats to Meituan LongCat team on launching LongCat-Flash-Chat — a 560B MoE model now open-sourced!
— LMSYS Org (@lmsysorg) September 2, 2025
Powered by SGLang inference acceleration, it achieves high efficiency and strong benchmark results.
Details in the blog 👉 https://t.co/O5iMvBhiIn https://t.co/aEHttUHnpv
Meituan just open sourced their new MoE LLM LongCat on @huggingface
— Tiezhen WANG (@Xianbao_QIAN) August 30, 2025
It's exciting to see new players! The model looks very interesting too with technical report.https://t.co/DduHMQxw5F pic.twitter.com/QMq0K8qJa0
LongCat Flash Chat Available Now on Chuteshttps://t.co/cRa7rR48BQ
— Chutes (@chutes_ai) August 31, 2025
$0.1999 USD IN
$0.8001 USD OUT
Try it out now with PAYG or an active subscription, which starts at $3 for 300 requests/day. https://t.co/pRo9IcGzSi pic.twitter.com/Hn7m8CnqEO
