革命性AI视频引擎:一个模型,包揽视频生成、编辑与再创作。
Wan2.1-VACE 不仅仅是视频生成,更是全能的视频创作伙伴。它以单一模型架构,赋予您前所未有的视频掌控力。
从文本描述或单张图片出发,凭空创造出全新的视频内容,将您的想象力转化为动态视觉。
对现有视频进行深度编辑,包括风格转换、对象替换、背景拓展等,赋予旧素材全新生命力。
无需切换不同工具,Wan2.1-VACE 以其统一的架构,高效完成从生成到编辑的所有视频处理任务。
Wan2.1-VACE 赋予您对视频每一帧的精细控制能力,让创意不再受限。
动作、姿态、方向,一切尽在掌握。
构图布局、运动轨迹,自由设定。
视频风格、整体风貌,随心定制。
支持多种输入方式,灵活组合,满足您多样化的创作需求。
Wan2.1-VACE 的强大之处在于其功能的灵活组合,轻松应对复杂创作需求。
组合“图片参考 + 背景延展 + 时长延展”,轻松将一张竖屏图片转化为横屏长视频,并智能填充和谐背景。
结合“参考图像 + 局部重绘”,仅替换视频中特定物体,同时完美保留其他元素不变,实现无痕编辑。
在这里找到关于 Wan2.1-VACE 模型的常见问题解答。
Wan2.1-VACE 是阿里巴巴万相实验室 (Wan-AI) 研发的一款开源多模态视频生成与编辑基础模型。它采用统一架构,支持文本到视频 (T2V)、图像到视频 (I2V)、视频到视频 (V2V) 编辑、参考图引导生成 (R2V) 和掩码视频编辑 (MV2V) 等多种复杂任务。
这是 Wan2.1-VACE 的核心设计理念。“All in One” 指其单一模型架构能处理多种视频创作与编辑任务,无需切换不同工具。“Wan for All” 则强调其普惠性,通过开源和支持消费级硬件,让更广泛的用户能接触和使用先进的 AI 视频技术。
主要功能包括:
主要有两个版本:Wan2.1-VACE-1.3B 和 Wan2.1-VACE-14B。
Wan2.1-VACE-1.3B: 轻量化版本,约13亿参数。主要支持480p分辨率视频,对消费级GPU友好(如T2V推理约需8.19GB VRAM)。适合个人创作者和快速原型验证。
Wan2.1-VACE-14B: 更大参数规模版本,约140亿参数。支持480p和更高质量的720p分辨率视频。性能更强,但对硬件要求也更高(如I2V推理约需35GB VRAM)。适合专业视频制作和高质量内容生成。
是的,Wan2.1-VACE 遵循 Apache 2.0 开源许可协议。
您可以从以下主要渠道获取模型和代码:
基本要求包括:
详细配置步骤通常涉及克隆代码库、安装依赖项和下载模型权重。
应用前景广泛,包括: