阿里巴巴 Wan2.1-VACE 开源模型

革命性AI视频引擎：一个模型，包揽视频生成、编辑与再创作。

释放创意：Wan2.1-VACE 核心功能

Wan2.1-VACE 不仅仅是视频生成，更是全能的视频创作伙伴。它以单一模型架构，赋予您前所未有的视频掌控力。

直接“生成”视频

从文本描述或单张图片出发，凭空创造出全新的视频内容，将您的想象力转化为动态视觉。

复杂编辑与再创作

对现有视频进行深度编辑，包括风格转换、对象替换、背景拓展等，赋予旧素材全新生命力。

单一模型全覆盖

无需切换不同工具，Wan2.1-VACE 以其统一的架构，高效完成从生成到编辑的所有视频处理任务。

精准掌控，随心所欲

Wan2.1-VACE 赋予您对视频每一帧的精细控制能力，让创意不再受限。

角色控制

动作、姿态、方向，一切尽在掌握。

视觉编排

构图布局、运动轨迹，自由设定。

风格定义

视频风格、整体风貌，随心定制。

多样化输入，激发无限可能

支持多种输入方式，灵活组合，满足您多样化的创作需求。

文本 (Prompt)
图像 (图片参考)
视频 (原视频编辑)
遮罩 Mask (指定修改区域)
控制信号 (深度图、光流图、灰度图、布局图、线稿等)

组合创新：解锁复杂应用场景

Wan2.1-VACE 的强大之处在于其功能的灵活组合，轻松应对复杂创作需求。

竖图变横屏长视频

组合“图片参考 + 背景延展 + 时长延展”，轻松将一张竖屏图片转化为横屏长视频，并智能填充和谐背景。

精准局部重绘

结合“参考图像 + 局部重绘”，仅替换视频中特定物体，同时完美保留其他元素不变，实现无痕编辑。

常见问题 (FAQ)

在这里找到关于 Wan2.1-VACE 模型的常见问题解答。

Wan2.1-VACE 是什么？

Wan2.1-VACE 是阿里巴巴万相实验室 (Wan-AI) 研发的一款开源多模态视频生成与编辑基础模型。它采用统一架构，支持文本到视频 (T2V)、图像到视频 (I2V)、视频到视频 (V2V) 编辑、参考图引导生成 (R2V) 和掩码视频编辑 (MV2V) 等多种复杂任务。

“All in One, Wan for All” 是什么意思？

这是 Wan2.1-VACE 的核心设计理念。“All in One” 指其单一模型架构能处理多种视频创作与编辑任务，无需切换不同工具。“Wan for All” 则强调其普惠性，通过开源和支持消费级硬件，让更广泛的用户能接触和使用先进的 AI 视频技术。

Wan2.1-VACE 有哪些主要功能？

主要功能包括：

- 文本到视频 (T2V) 生成
- 图像到视频 (I2V) 生成
- 首尾帧到视频 (FLF2V) 生成
- 参考图引导的视频生成 (R2V)
- 视频到视频 (V2V) 编辑 (如风格转换、内容调整)
- 基于掩码的视频编辑 (MV2V) (如修复、对象替换、场景扩展)
- 中英双语视觉文本生成 (在视频画面中渲染文字)
- 任务可组合性，实现复杂编辑流程

Wan2.1-VACE 有哪些不同版本？主要区别是什么？

主要有两个版本：Wan2.1-VACE-1.3B 和 Wan2.1-VACE-14B。

Wan2.1-VACE-1.3B: 轻量化版本，约13亿参数。主要支持480p分辨率视频，对消费级GPU友好（如T2V推理约需8.19GB VRAM）。适合个人创作者和快速原型验证。

Wan2.1-VACE-14B: 更大参数规模版本，约140亿参数。支持480p和更高质量的720p分辨率视频。性能更强，但对硬件要求也更高（如I2V推理约需35GB VRAM）。适合专业视频制作和高质量内容生成。

Wan2.1-VACE 是开源的吗？在哪里可以找到它？

是的，Wan2.1-VACE 遵循 Apache 2.0 开源许可协议。

您可以从以下主要渠道获取模型和代码：

- - Hugging Face: Wan-AI 组织页面 and ali-vilab 页面
- - GitHub: Wan-Video/Wan2.1 代码库
- - ModelScope: 阿里巴巴的开源模型社区

在本地部署 Wan2.1-VACE 有什么系统要求？

基本要求包括：

- 操作系统: Windows, macOS, 或 Linux。
- 内存 (RAM): 建议至少 16GB，复杂任务或大模型可能需要更多。
- GPU: 这是关键。显存 (VRAM) 需求依模型版本而定，1.3B 版本 T2V 约需 8.19GB+，14B 版本需求更高。推荐使用 NVIDIA GPU。
- 软件: Python (如 3.10+), CUDA, PyTorch。具体版本请参考官方文档或社区指南。

详细配置步骤通常涉及克隆代码库、安装依赖项和下载模型权重。

Wan2.1-VACE 可以应用于哪些场景？

应用前景广泛，包括：

- 内容创作与营销: 社交媒体短片、广告、产品演示、教学材料。
- 艺术可视化与娱乐: 动态视觉艺术、实验短片、动画概念。
- 游戏开发: 过场动画、角色动作预览、动态背景。
- 影视前期制作: 视频概念原型、故事板动态化。
- 个性化内容定制: 定制祝福视频、教学片段等。