Lanzamiento Lightricks 2026.03

LTX-2.3

El nuevo estándar en video de IA de código abierto. Arquitectura DiT de modelo único con sincronización de audio nativa.

20s
Duración Máx.
1080P
Vertical Nativo
50 FPS
Alta Tasa de Fotogramas
Sync
Sincronización de Audio

¿Qué es LTX-2.3?

LTX-2.3 es un modelo de generación de video de IA de código abierto de Lightricks, que representa la última iteración de la familia LTX-2. Es un modelo fundacional de Diffusion Transformer (DiT) capaz de generar video de alta fidelidad y audio sincronizado simultáneamente.

Soporta modos T2V (texto a video), I2V (imagen a video) y A2V (audio a video). Aclamado como el "Veo 3 de código abierto", ofrece ejecución local a costo cero y una calidad que rivaliza con los mejores modelos cerrados.

LTX-2.3 vs LTX-2

CaracterísticaLTX-2 (Anterior)LTX-2.3 (Actual)
VAE y Espacio LatenteResolución estándar✅ Reconstruido para texturas 40% más nítidas
Adherencia al PromptDificultad con instrucciones complejas✅ Capacidad de texto 4x con atención controlada (gated attention)
Consistencia I2VOcasionales "fotogramas congelados"✅ Ultra consistente, menos artefactos
Calidad de AudioRuido de fondo notable✅ Calidad de estudio con sincronización a nivel de milisegundos

Guía de Prompts Avanzados para LTX-2.3

Orden cronológico: Describe las secuencias paso a paso.

Palabras clave cinematográficas: Usa "Primer plano", "Toma de grúa", etc.

Iluminación: Añade "Luz volumétrica", "Neón", etc.

Etiquetas de audio: Menciona "Bajos pesados", "Sonido de lluvia" en los prompts.

Mejoras Principales

Optimizado para Producción Profesional

Detalles más Nítidos

Cabello, texturas y bordes más claros.

Mejor Seguimiento

Nueva atención controlada para prompts complejos.

I2V Realista

Reducción de fotogramas congelados y mejor consistencia.

Audio más Limpio

Filtrado optimizado + nuevo vocoder.

Aspectos Destacados

Vertical Nativo

1080x1920 para TikTok/Shorts.

Guiado por Audio

El audio impulsa el movimiento y la sincronización labial.

Multimodal

Soporta Fotogramas Clave, Depth/Pose/Canny.

Especificaciones

Resolución Hasta 1080p (Vertical Nativo), 4K Upscale
Duración Hasta 20s (extensible)
Tasa de Fotogramas 24 / 48 / 50 FPS
Tamaño del Modelo Aprox. 22B Parámetros
Velocidad Segundos localmente (depende de la VRAM)
Licencia LTX Community (Gratis para ingresos <$10M)

Descarga

Disponible en Hugging Face.

LTX-2.3-22B-Dev

Versión completa bf16, la mejor calidad.

LTX-2.3-22B-Distilled

Versión destilada, eficiencia en 8 pasos.

FP8 Cuantizado

Ideal para 12GB de VRAM.

Ejecutar Localmente

  • 01 Recomendado: Nodo personalizado ComfyUI-LTXVideo.
  • 02 Soporta scripts oficiales, CLI y Fal.ai.
  • 03 LTX Desktop: Editor profesional de código abierto.

Notas

Usa una estructura de prompt cronológica. Se recomienda cuantización para VRAM baja. Sigue las pautas de seguridad de la comunidad.

"LTX-2.3 es la solución definitiva de código abierto para video y audio sincronizados."

© 2026 wan2.video