2026.03 深度評測
LTX-2.3 vs Wan 2.2
開源影片模型雙雄爭霸。一個是「短影音生產力利器」,一個是「電影級畫質天花板」,誰更適合你?
一句話總結
L
LTX-2.3
想快速迭代 + 原生帶聲 + 直式短影音 → 選 LTX-2.3
W
Wan 2.2
想要電影級細節、複雜動作、最終成片品質 → 選 Wan 2.2 (尤其是生產級輸出)
1. 核心技術規格對比
| 項目 | LTX-2.3 (Lightricks) | Wan 2.2 (Wan-AI) |
|---|---|---|
| 架構 | 單模型 DiT (22B 參數) | MoE 雙專家 (A14B 系列 27B / TI2V-5B) |
| 主要變體 | 22B-dev / 22B-distilled + Upscalers | T2V-A14B, I2V-A14B, TI2V-5B, S2V, Animate |
| 原生解析度 | 最高 1080p (原生直式) + 4K Upscale | 480P ~ 720P (支援寬比例) |
| 影格率 | 24 / 48 / 50 FPS | 24 FPS (TI2V-5B) |
| 音訊支援 | 原生音畫同步 (一次生成,唇形同步極強) | 需單獨 S2V 變體實現語音驅動 |
| 授權條款 | LTX Community (營收<$10M免費) | Apache 2.0 (完全開源商用) |
2. 生成品質與表現評測
提示詞遵循
WINNER: Wan 2.2
LTX-2.3
大幅提升,但複雜空間關係仍有漂移
Wan 2.2
頂級 (MoE 雙專家,語意理解極強)
運動一致性
WINNER: Wan 2.2
LTX-2.3
好,但快動作/長序列易崩
Wan 2.2
極強 (低噪專家專精,影格間連貫)
細節/銳利度
WINNER: Wan 2.2
LTX-2.3
重建 VAE 後細節大幅改善
Wan 2.2
更精緻 (光影/材質具電影感)
音訊同步
WINNER: LTX-2.3
LTX-2.3
碾壓級 (原生 Vocoder,節奏完美)
Wan 2.2
效果好但需單獨生成步驟
3. 效能與本機部署對比
生成速度
LTX-2.3 極快 (Distilled 僅需幾秒)
Wan 2.2 較慢 (A14B 需較長取樣)
VRAM 需求
LTX-2.3 10-18GB (1080p 輕鬆)
Wan 2.2 24GB (5B) / 80GB+ (A14B)
ComfyUI 支援
LTX-2.3 最完善 (官方節點 + 範本庫)
Wan 2.2 優秀 (官方 + Kijai Wrapper)
4. 適用場景推薦
強烈推薦 LTX-2.3
- TikTok / Reels 短影音 (直式+音訊)
- 虛擬實況主 (VTuber)、帶旁白短劇
- 12-24GB VRAM 使用者
- 需要完美唇形同步的角色影片
最終結論
"畫質天花板選 Wan 2.2;速度與短影音效率選 LTX-2.3。高手通常雙模型配合:LTX 出草稿+音訊,Wan 精修畫質。"