LTX-2.3
O novo padrão em vídeo de IA de código aberto. Arquitetura DiT de modelo único com sincronização de áudio nativa.
O que é o LTX-2.3?
O LTX-2.3 é um modelo de geração de vídeo por IA de código aberto da Lightricks, representando a mais recente iteração da família LTX-2. É um modelo fundacional Diffusion Transformer (DiT) capaz de gerar vídeo de alta fidelidade e áudio sincronizado simultaneamente.
Suportando os modos T2V (Texto para Vídeo), I2V (Imagem para Vídeo) e A2V (Áudio para Vídeo), é aclamado como o "Veo 3 de código aberto", oferecendo execução local sem custo e qualidade que rivaliza com os melhores modelos fechados.
LTX-2.3 vs LTX-2
| Recurso | LTX-2 (Antigo) | LTX-2.3 (Atual) |
|---|---|---|
| VAE e Espaço Latente | Resolução padrão | ✅ Reconstruído para texturas 40% mais nítidas |
| Adesão ao Prompt | Dificuldade com instruções complexas | ✅ Capacidade de texto 4x com "gated attention" |
| Consistência I2V | Quadros congelados ocasionais | ✅ Ultra consistente, menos artefatos |
| Qualidade de Áudio | Ruído de fundo perceptível | ✅ Limpeza de estúdio com sincronização em milissegundos |
Guia de Prompts Avançados LTX-2.3
Ordem cronológica: Descreva as sequências passo a passo.
Palavras-chave cinematográficas: Use "Close-up", "Tomada de grua", etc.
Iluminação: Adicione "Luz volumétrica", "Neon", etc.
Tags de áudio: Mencione "Baixos pesados", "Som de chuva" nos prompts.
Principais Melhorias
Otimizado para Produção Profissional
Detalhes Mais Nítidos
Cabelos, texturas e bordas mais claros.
Melhor Compreensão
Nova "gated attention" para prompts complexos.
I2V Realista
Redução de quadros congelados e melhor consistência.
Áudio Mais Limpo
Filtragem otimizada + novo vocoder.
Destaques
Vertical Nativo
1080x1920 para TikTok/Shorts.
Guiado por Áudio
O áudio impulsiona o movimento e a sincronização labial.
Multimodal
Suporta Keyframes, Depth/Pose/Canny.
Especificações
Executar Localmente
- 01 Recomendado: Nó personalizado ComfyUI-LTXVideo.
- 02 Suporta scripts oficiais, CLI e Fal.ai.
- 03 LTX Desktop: Editor profissional de código aberto.
Notas
"O LTX-2.3 é a solução definitiva de código aberto para vídeo e áudio sincronizados."