Lancement Lightricks 2026.03

LTX-2.3

La nouvelle référence de la vidéo IA open-source. Architecture DiT à modèle unique avec synchronisation audio native.

20s
Durée Max
1080P
Vertical Natif
50 FPS
Fréquence d'images
Sync
Synchro Audio

Qu'est-ce que LTX-2.3 ?

LTX-2.3 est un modèle de génération de vidéo IA open-source créé par Lightricks, représentant la dernière itération de la famille LTX-2. C'est un modèle de base Diffusion Transformer (DiT) capable de générer simultanément des vidéos haute fidélité et un son synchronisé.

Prenant en charge les modes T2V (Texte-à-Vidéo), I2V (Image-à-Vidéo) et A2V (Audio-à-Vidéo), il est salué comme le « Veo 3 open-source », offrant une exécution locale sans coût et une qualité rivalisant avec les meilleurs modèles fermés.

LTX-2.3 vs LTX-2

FonctionnalitéLTX-2 (Ancien)LTX-2.3 (Actuel)
VAE & Espace LatentRésolution standard✅ Reconstruit pour des textures 40% plus nettes
Respect du PromptDifficultés avec les instructions complexes✅ Capacité textuelle 4x avec "gated attention"
Cohérence I2VImages gelées occasionnelles✅ Ultra-cohérent, moins d'artefacts
Qualité AudioBruit de fond perceptible✅ Qualité studio avec synchro de l'ordre de la milliseconde

Guide des Prompts Avancés LTX-2.3

Ordre chronologique : Décrivez les séquences étape par étape.

Mots-clés cinématographiques : Utilisez "Gros plan", "Plan grue", etc.

Éclairage : Ajoutez "Lumière volumétrique", "Néon", etc.

Tags audio : Mentionnez "Basses lourdes", "Bruit de pluie" dans les prompts.

Améliorations Principales

Optimisé pour la Production Professionnelle

Détails plus nets

Cheveux, textures et contours plus clairs.

Meilleur Suivi

Nouvelle "gated attention" pour les prompts complexes.

I2V Réaliste

Réduction des images gelées et meilleure cohérence.

Audio plus Propre

Filtrage optimisé + nouveau vocodeur.

Points Forts

Vertical Natif

1080x1920 pour TikTok/Shorts.

Guidé par l'Audio

L'audio pilote le mouvement et la synchronisation labiale.

Multimodal

Supporte les Keyframes, Depth/Pose/Canny.

Spécifications

Résolution Jusqu'à 1080p (Vertical Natif), Upscale 4K
Durée Jusqu'à 20s (extensible)
Fréquence d'images 24 / 48 / 50 FPS
Taille du Modèle Env. 22B Paramètres
Vitesse Quelques secondes en local (selon la VRAM)
Licence LTX Community (Gratuit pour revenus < 10M$)

Téléchargement

Disponible sur Hugging Face.

LTX-2.3-22B-Dev

Version complète bf16, qualité optimale.

LTX-2.3-22B-Distilled

Version distillée, efficacité en 8 étapes.

FP8 Quantifié

Idéal pour 12 Go de VRAM.

Exécuter Localement

  • 01 Recommandé : Nœud personnalisé ComfyUI-LTXVideo.
  • 02 Supporte les scripts officiels, CLI et Fal.ai.
  • 03 LTX Desktop : Éditeur professionnel open-source.

Remarques

Utilisez une structure de prompt chronologique. Quantification recommandée pour les faibles VRAM. Respectez les directives de sécurité de la communauté.

"LTX-2.3 est la solution open-source ultime pour la vidéo et l'audio synchronisés."

© 2026 wan2.video