LTX-2.3
Der neue Maßstab für Open-Source-KI-Videos. Single-Model DiT-Architektur mit nativer Audiosynchronisation.
Was ist LTX-2.3?
LTX-2.3 ist ein Open-Source-Modell zur KI-Videogenerierung von Lightricks und die neueste Version der LTX-2-Familie. Es ist ein Single-Model Diffusion Transformer (DiT), das hochauflösende Videos und synchronisierten Ton gleichzeitig erzeugt.
Es unterstützt T2V (Text-zu-Video), I2V (Bild-zu-Video) und A2V (Audio-zu-Video). Von der Community als „Open-Source Veo 3“ gefeiert, bietet es kostenlose lokale Ausführung, hohe Geschwindigkeiten und eine Qualität, die an geschlossene Top-Modelle heranreicht.
LTX-2.3 vs LTX-2
| Funktion | LTX-2 (Alt) | LTX-2.3 (Aktuell) |
|---|---|---|
| VAE & Latenter Raum | Standardauflösung | ✅ Neu aufgebaut für 40% schärfere Texturen |
| Prompt-Treue | Probleme bei komplexen Anweisungen | ✅ 4-fache Textkapazität durch Gated Attention |
| I2V Konsistenz | Gelegentlich eingefrorene Frames | ✅ Ultra-konsistent, weniger Artefakte |
| Audioqualität | Spürbare Hintergrundgeräusche | ✅ Studioqualität mit millisekundengenauer Synchronisation |
LTX-2.3 Fortgeschrittenes Prompting
Chronologische Reihenfolge: Beschreibe Abläufe Schritt für Schritt.
Filmische Schlüsselwörter: Nutze "Nahaufnahme", "Kranfahrt", etc.
Beleuchtung: Füge "Volumetrisches Licht", "Neon", etc. hinzu.
Audio-Tags: Erwähne "Tiefer Bass", "Regengeräusche" in Prompts.
Kernverbesserungen
Optimiert für professionelle Produktion
Schärfere Details
Klarere Haare, Texturen und Kanten.
Bessere Umsetzung
Neue Gated Attention für komplexe Prompts.
Realistisches I2V
Reduzierte Frame-Freezes und bessere Konsistenz.
Saubereres Audio
Optimierte Filterung + neuer Vocoder.
Highlights
Natives Hochformat
1080x1920 für TikTok/Shorts.
Audio-Gesteuert
Audio steuert Bewegung und Lippensynchronisation.
Multimodal
Unterstützt Keyframes, Depth/Pose/Canny.
Spezifikationen
Lokal Ausführen
- 01 Empfohlen: ComfyUI-LTXVideo Custom Node.
- 02 Unterstützt offizielle Skripte, CLI und Fal.ai.
- 03 LTX Desktop: Professioneller Open-Source-Editor.
Hinweise
"LTX-2.3 ist die ultimative Open-Source-Lösung für synchronisiertes Video/Audio."