オープンソース🚀 美団LongCat-Video 13.6BベースMITライセンス！

LongCat-Video: 次世代AI動画ジェネレーターモデル

LongCat-Video: テキストや画像から動画を作成し、既存の動画を継続するオープンソースAI（テキストから動画、画像から動画、動画継続タスク）。

LongCat-Videoライブデモを試す

LongCat-Videoの力をリアルタイムで体験してください。テキストや画像から動画を生成し、素晴らしい結果をご覧ください。

Loading LongCat-Video demo...

LongCat-Videoとは

LongCat-Videoは美団による136億パラメータの基盤動画生成モデルです。テキストから動画、画像から動画、動画継続タスクを単一モデル内でサポートする統合アーキテクチャを特徴とします。LongCat-Videoは長動画生成をネイティブサポートし、色ずれや品質劣化なしに数分間の動画を生成し、粗密生成戦略を使用して720p 30fps動画を効率的に生成します。

テキストから動画生成
高度なニューラルネットワークでテキストプロンプトを高品質な動画に変換。簡単なテキスト説明から魅力的な視覚コンテンツを作成。
画像から動画生成
滑らかな動画アニメーションを生成して静止画に命を吹き込む。インテリジェントなモーション合成で単一画像からダイナミックなコンテンツを作成。
動画継続
品質損失や色ずれなしに既存動画をシームレスに拡張。一貫した品質と自然な遷移で数分間の動画を生成。

モデル比較

異なるタスクとメトリクスでLongCat-Videoを他の最先端動画生成モデルと比較。

テキストから動画パフォーマンス

モデル	アクセシビリティ	アーキテクチャ	パラメータ	テキスト整合性	視覚品質	モーション品質	総合品質
Veo3	プロプライエタリ	-	-	3.99	3.23	3.86	3.48
PixVerse-V5	プロプライエタリ	-	-	3.81	3.13	3.81	3.36
Wan 2.2-T2V-A14B	オープンソース	MoE	28B (14B Active)	3.70	3.26	3.78	3.35
LongCat-Video	オープンソース	Dense	13.6B	3.76	3.25	3.74	3.38

画像から動画パフォーマンス

モデル	アクセシビリティ	アーキテクチャ	パラメータ	画像整合性	テキスト整合性	視覚品質	モーション品質	総合品質
Seedance 1.0	プロプライエタリ	-	-	4.12	3.70	3.22	3.77	3.35
Hailuo-02	プロプライエタリ	-	-	4.18	3.85	3.18	3.80	3.27
Wan 2.2-I2V-A14B	オープンソース	MoE	28B (14B Active)	4.18	3.33	3.23	3.79	3.26
LongCat-Video	オープンソース	Dense	13.6B	4.04	3.49	3.27	3.59	3.17

はじめに

クイックスタート

以下の手順に従ってLongCat-Videoをセットアップし、数分で動画生成を開始できます。

bash

#facc15;">"color: #4ade80;">git "color: #4ade80;">clone https://github.com/meituan-longcat/LongCat-Video."color: #4ade80;">git
cd LongCat-Video

LongCat-Videoの主要機能

世界中のクリエイターと開発者向けに設計された高度なAI動画生成機能。

統合マルチタスクフレームワーク

すべての生成モードで一貫した高パフォーマンスを持つテキストから動画、画像から動画、動画継続タスクをサポートする単一モデル。

長動画生成

色ずれや品質劣化なしに数分間の動画を生成するために動画継続タスクでネイティブに事前訓練。

高品質出力

高度なニューラルネットワークアーキテクチャと最適化技術を使用してプロフェッショナル品質の720p、30fps動画を生成。

効率的な推論

GPU加速による時間的・空間的軸に沿った粗密生成戦略を使用して数分以内の高速動画生成。

強力なパフォーマンス

主要なオープンソースおよび商用動画生成モデルに匹敵するパフォーマンスを達成するマルチリワードGRPO最適化により動力。

オープンソース＆MITライセンス

研究および商用アプリケーション向けにGitHubとHugging Faceで利用可能なMITライセンス付き完全オープンソースモデル。

XでLongCat-Videoについて話していること

ソーシャルメディアでのLongCat-Videoに関する会話に参加

Loading tweets...

LongCat-Video: 次世代AI動画ジェネレーターモデル

LongCat-Videoライブデモを試す

LongCat-Videoとは

モデル比較

テキストから動画パフォーマンス

画像から動画パフォーマンス

クイックスタート

1. リポジトリのクローン

2. 依存関係のインストール

3. モデルのダウンロード

4. テキストから動画生成を実行

LongCat-Videoの主要機能

統合マルチタスクフレームワーク

長動画生成

高品質出力

効率的な推論

強力なパフォーマンス

オープンソース＆MITライセンス

XでLongCat-Videoについて話していること

FAQ

LongCat-Video: 次世代AI動画ジェネレーターモデル

LongCat-Videoライブデモを試す

LongCat-Videoとは

モデル比較

テキストから動画パフォーマンス

画像から動画パフォーマンス

クイックスタート

11. リポジトリのクローンGitHubからLongCat-Videoのソースコードを取得

1. リポジトリのクローン

22. 依存関係のインストール必要なPythonパッケージをすべてインストール

2. 依存関係のインストール

33. モデルのダウンロード事前学習済みLongCat-Videoモデルのダウンロード

3. モデルのダウンロード

44. テキストから動画生成を実行テキストプロンプトから動画を生成

4. テキストから動画生成を実行

LongCat-Videoの主要機能

統合マルチタスクフレームワーク

長動画生成

高品質出力

効率的な推論

強力なパフォーマンス

オープンソース＆MITライセンス

XでLongCat-Videoについて話していること

FAQ

LongCat-Videoとは何で、どのように動作しますか？

LongCat-Videoはどのような種類の動画を生成できますか？

LongCat-Videoを使用するために何かインストールする必要がありますか？

LongCat-Videoの生成システムの主要機能は何ですか？

LongCat-Videoをアプリケーションに統合できますか？

LongCat-Videoは他の動画生成モデルと比較してどうですか？