LTX-2.3
El nuevo estándar en video de IA de código abierto. Arquitectura DiT de modelo único con sincronización de audio nativa.
¿Qué es LTX-2.3?
LTX-2.3 es un modelo de generación de video de IA de código abierto de Lightricks, que representa la última iteración de la familia LTX-2. Es un modelo fundacional de Diffusion Transformer (DiT) capaz de generar video de alta fidelidad y audio sincronizado simultáneamente.
Soporta modos T2V (texto a video), I2V (imagen a video) y A2V (audio a video). Aclamado como el "Veo 3 de código abierto", ofrece ejecución local a costo cero y una calidad que rivaliza con los mejores modelos cerrados.
LTX-2.3 vs LTX-2
| Característica | LTX-2 (Anterior) | LTX-2.3 (Actual) |
|---|---|---|
| VAE y Espacio Latente | Resolución estándar | ✅ Reconstruido para texturas 40% más nítidas |
| Adherencia al Prompt | Dificultad con instrucciones complejas | ✅ Capacidad de texto 4x con atención controlada (gated attention) |
| Consistencia I2V | Ocasionales "fotogramas congelados" | ✅ Ultra consistente, menos artefactos |
| Calidad de Audio | Ruido de fondo notable | ✅ Calidad de estudio con sincronización a nivel de milisegundos |
Guía de Prompts Avanzados para LTX-2.3
Orden cronológico: Describe las secuencias paso a paso.
Palabras clave cinematográficas: Usa "Primer plano", "Toma de grúa", etc.
Iluminación: Añade "Luz volumétrica", "Neón", etc.
Etiquetas de audio: Menciona "Bajos pesados", "Sonido de lluvia" en los prompts.
Mejoras Principales
Optimizado para Producción Profesional
Detalles más Nítidos
Cabello, texturas y bordes más claros.
Mejor Seguimiento
Nueva atención controlada para prompts complejos.
I2V Realista
Reducción de fotogramas congelados y mejor consistencia.
Audio más Limpio
Filtrado optimizado + nuevo vocoder.
Aspectos Destacados
Vertical Nativo
1080x1920 para TikTok/Shorts.
Guiado por Audio
El audio impulsa el movimiento y la sincronización labial.
Multimodal
Soporta Fotogramas Clave, Depth/Pose/Canny.
Especificaciones
Ejecutar Localmente
- 01 Recomendado: Nodo personalizado ComfyUI-LTXVideo.
- 02 Soporta scripts oficiales, CLI y Fal.ai.
- 03 LTX Desktop: Editor profesional de código abierto.
Notas
"LTX-2.3 es la solución definitiva de código abierto para video y audio sincronizados."