Generación de Vídeo con IA de Tongyi Wanxiang

Wan 2.5 Preview

Una revolución en la narración multisensorial. Integrando audio nativo con control visual de calidad cinematográfica, redefiniendo los límites de la creación de vídeo con IA.

Salto Generacional en Capacidades

Wan 2.5 integra la esencia de los modelos anteriores al tiempo que logra avances cualitativos en dimensiones clave.

Narración Multisensorial

Primera implementación de procesamiento sincronizado de audio y video, que proporciona narración nativa, sincronización de labios precisa y efectos de sonido ambientales inmersivos.

Calidad Cinematográfica 4K

Admite una salida de resolución de hasta 4K, presentando rostros, texturas de piel y detalles de ropa fotorrealistas que cumplen con los estándares de producción profesional.

Control Cinematográfico Preciso

Proporciona controles de cámara avanzados que incluyen panorámica, zoom y cambio de enfoque, lo que permite a los creadores 'dirigir' escenas en lugar de solo 'describirlas'.

Duración Narrativa Extendida

Admite la generación de videoclips de hasta 10+ segundos, suficientes para formar un ritmo narrativo completo o un anuncio corto.

Camino de la Evolución: Del Código Abierto a la Cima

Wan 2.5 se apoya en hombros de gigantes, representando el resultado inevitable de la iteración técnica y la evolución estratégica.

Wan 2.1 / 2.2

Fundación de Código Abierto

Estableció el liderazgo de la comunidad y popularizó la generación de video de alto rendimiento.


Revolución de la Arquitectura MoE

Introdujo la arquitectura Mixture-of-Experts, logrando un rendimiento de modelo escalable.

Wan 2.5 Preview

Integración de Capacidades

Integra audio, animación y control avanzado en un modelo unificado.


API Comercial

Se desplaza al mercado profesional de alta gama, proporcionando servicios de API de código cerrado.

Remodelando la Estructura del Mercado

El lanzamiento de Wan 2.5 marca la entrada del mercado de vídeo generativo en una nueva era de estructura de tres niveles.

Nivel 1: Código Cerrado de Alta Gama

Referente de la Industria

Modelos insignia proporcionados por los principales laboratorios (OpenAI, Google, Alibaba) a través del acceso a la API, buscando la más alta calidad y el control más fuerte.

Representantes: Sora, Veo, Wan 2.5

Nivel 2: Código Abierto Heredado

Pilar de la Comunidad

Modelos de código abierto de alta calidad pero de una generación anterior, que sirven como núcleo para la experimentación, el aprendizaje y los proyectos no comerciales de la comunidad.

Representantes: Wan 2.2, Stable Video Diffusion

Nivel 3: Código Abierto Independiente

Pioneros de la Innovación

Modelos pequeños o especializados impulsados por la comunidad que proporcionan características únicas u optimizadas para hardware específico, sirviendo como fuente de diversidad del ecosistema.

Representantes: Modelos de la Comunidad

Comparación de Características y Arquitectura de la Serie de Modelos Wan

La siguiente tabla demuestra intuitivamente el camino completo de evolución de la serie de modelos Wan desde la accesibilidad abierta hasta la comercialización profesional, comparando la arquitectura central, las innovaciones clave y los modelos de lanzamiento.

Arquitectura CentralWan 2.1Wan 2.2Wan 2.5 Preview (Anunciado/Especulado)
Arquitectura CentralStandard Diffusion TransformerMixture-of-Experts (MoE) (Ruido Alto/Bajo)Arquitectura MoE Evolucionada
Escala del ModeloParámetros de 1.3B y 14B14B activos / 27B parámetros totalesPosiblemente >30B parámetros totales
Innovación ClaveAccesibilidad y eficiencia de código abiertoMoE logra un rendimiento escalableMultimodal integrado (audio-video)
Resolución Máxima720p (inestable), 480p (recomendado)720p / 1080p4K (declarado), 1080p (confirmado por API)
Duración Máxima~3-5 segundos~5 segundos10+ segundos
Modalidad PrincipalT2V, I2V, edición de videoT2V, I2V y modelos dedicados S2V y AnimateT2V, I2V unificados, sincronización de audio y video, animación avanzada
Control CinematográficoBásico"Control estético cinematográfico"Control preciso de cámara, iluminación y escena
Modelo de LanzamientoCódigo abierto (Apache 2.0)Código abierto (Apache 2.0)Solo API (código cerrado)