Motor Revolucionario de Video IA: Un modelo para la generación, edición y recreación de video.
Wan2.1-VACE es más que solo generación de video; es un socio de creación de video todo en uno. Su arquitectura de modelo único le brinda un control sin precedentes sobre el video.
Cree contenido de video completamente nuevo a partir de descripciones de texto o imágenes individuales, transformando su imaginación en visuales dinámicos.
Realice ediciones profundas en videos existentes, incluyendo transferencia de estilo, reemplazo de objetos, extensión de fondo, etc., dando nueva vida al metraje antiguo.
No es necesario cambiar entre diferentes herramientas. Wan2.1-VACE completa eficientemente todas las tareas de procesamiento de video desde la generación hasta la edición con su arquitectura unificada.
Wan2.1-VACE le brinda un control detallado sobre cada fotograma del video, liberando su creatividad.
Acción, postura, dirección, todo bajo su control.
Diseño, trayectoria de movimiento, configure libremente.
Estilo de video, aspecto general, personalice a su gusto.
Admite múltiples métodos de entrada, combinados de manera flexible para satisfacer sus diversas necesidades de creación.
El poder de Wan2.1-VACE radica en la combinación flexible de sus funciones, manejando fácilmente las complejas demandas de creación.
Combine "Referencia de Imagen + Extensión de Fondo + Extensión de Duración" para convertir fácilmente una imagen vertical en un video largo horizontal con un fondo armonioso rellenado inteligentemente.
Combine "Imagen de Referencia + Inpainting Local" para reemplazar solo objetos específicos en el video mientras se conservan perfectamente otros elementos, logrando una edición impecable.
Encuentre respuestas a preguntas comunes sobre el modelo Wan2.1-VACE aquí.
Wan2.1-VACE es un modelo fundacional de generación y edición de video multimodal de código abierto desarrollado por Alibaba Wan-AI Lab. Emplea una arquitectura unificada que admite varias tareas complejas como Texto a Video (T2V), Imagen a Video (I2V), edición de Video a Video (V2V), generación guiada por referencia (R2V) y Edición de Video Enmascarado (MV2V).
"All in One, Wan for All" es la filosofía de diseño central de Wan2.1-VACE. "All in One" se refiere a su arquitectura de modelo único capaz de manejar múltiples tareas de creación y edición de video sin necesidad de cambiar de herramienta. "Wan for All" enfatiza su inclusividad, permitiendo que una gama más amplia de usuarios acceda y utilice tecnología de video IA avanzada a través del código abierto y el soporte para hardware de grado de consumidor.
Las características principales incluyen:
Hay dos versiones principales: Wan2.1-VACE-1.3B y Wan2.1-VACE-14B.
Wan2.1-VACE-1.3B: Una versión ligera con aproximadamente 1.3 mil millones de parámetros. Admite principalmente video con resolución de 480p y es compatible con GPU de grado de consumidor (por ejemplo, la inferencia T2V requiere aproximadamente 8.19GB de VRAM). Adecuado para creadores individuales y creación rápida de prototipos.
Wan2.1-VACE-14B: Una versión de mayor escala de parámetros con aproximadamente 14 mil millones de parámetros. Admite video con resolución de 480p y 720p de mayor calidad. Ofrece un rendimiento más sólido pero tiene requisitos de hardware más altos (por ejemplo, la inferencia I2V requiere aproximadamente 35GB de VRAM). Adecuado para la producción de video profesional y la generación de contenido de alta calidad.
Sí, Wan2.1-VACE está licenciado bajo la licencia de código abierto Apache 2.0.
Puede obtener el modelo y el código de los siguientes canales principales:
Los requisitos básicos incluyen:
Los pasos detallados de configuración generalmente implican clonar el repositorio, instalar dependencias y descargar los pesos del modelo.
Las perspectivas de aplicación son amplias, incluyendo: