2026.03 深度评测
LTX-2.3 vs Wan 2.2
开源视频模型双雄争霸。一个是“短视频生产力利器”,一个是“电影级画质天花板”,谁更适合你?
一句话总结
L
LTX-2.3
想快速迭代 + 原生带声 + 竖版短视频 → 选 LTX-2.3
W
Wan 2.2
想要电影级细节、复杂动作、最终成片质量 → 选 Wan 2.2 (尤其是生产级输出)
1. 核心技术规格对比
| 项目 | LTX-2.3 (Lightricks) | Wan 2.2 (Wan-AI) |
|---|---|---|
| 架构 | 单模型 DiT (22B 参数) | MoE 双专家 (A14B 系列 27B / TI2V-5B) |
| 主要变体 | 22B-dev / 22B-distilled + Upscalers | T2V-A14B, I2V-A14B, TI2V-5B, S2V, Animate |
| 原生分辨率 | 最高 1080p (原生竖版) + 4K Upscale | 480P ~ 720P (支持宽比例) |
| 帧率 | 24 / 48 / 50 FPS | 24 FPS (TI2V-5B) |
| 音频支持 | 原生音画同步 (一口出,唇同极强) | 需单独 S2V 变体实现语音驱动 |
| 许可证 | LTX Community (营收<$10M免费) | Apache 2.0 (完全开源商用) |
2. 生成质量与表现评测
提示词遵循
WINNER: Wan 2.2
LTX-2.3
大幅提升,但复杂空间关系仍有漂移
Wan 2.2
顶级 (MoE 双专家,语义理解极强)
运动一致性
WINNER: Wan 2.2
LTX-2.3
好,但快动作/长序列易崩
Wan 2.2
极强 (低噪专家专精,帧间连贯)
细节/锐利度
WINNER: Wan 2.2
LTX-2.3
重建 VAE 后细节大幅改善
Wan 2.2
更精致 (光影/材质具电影感)
音频同步
WINNER: LTX-2.3
LTX-2.3
碾压级 (原生 Vocoder,节奏完美)
Wan 2.2
效果好但需单独生成步骤
3. 性能与本地部署对比
生成速度
LTX-2.3 极快 (Distilled 仅需几秒)
Wan 2.2 较慢 (A14B 需较长采样)
显存需求
LTX-2.3 10-18GB (1080p 轻松)
Wan 2.2 24GB (5B) / 80GB+ (A14B)
ComfyUI 支持
LTX-2.3 最完善 (官方节点 + 模板库)
Wan 2.2 优秀 (官方 + Kijai Wrapper)
4. 适用场景推荐
最终结论
"画质天花板选 Wan 2.2;速度与短视频效率选 LTX-2.3。高手通常双模型配合:LTX 出草稿+音频,Wan 精修画质。"