Wan2.1 अलीबाबा के शक्तिशाली ओपन-सोर्स वीडियो जनरेशन मॉडल की एक श्रृंखला है।
श्रृंखला में शामिल हैं:
मॉडल प्रकार | रिज़ॉल्यूशन | VRAM (लगभग) |
---|---|---|
टेक्स्ट-टू-वीडियो 14B (T2V) | 480P / 720P | ~40GB |
टेक्स्ट-टू-वीडियो 1.3B (T2V) | 480P | ~8–15GB |
इमेज-टू-वीडियो 14B (I2V) | 480P / 720P | ~40GB |
विज़ुअल टेक्स्ट जनरेशन | बहुभाषी (चीनी/अंग्रेजी) | चर |
फ़ाइल विवरण | फ़ाइल नाम (डाउनलोड करने के लिए क्लिक करें) | लक्ष्य फ़ोल्डर |
---|---|---|
टेक्स्ट एन्कोडर | umt5_xxl_fp8_e4m3fn_scaled.safetensors | ComfyUI/models/text_encoders/ |
VAE | wan_2.1_vae.safetensors | ComfyUI/models/vae/ |
CLIP विजन (इमेज-टू-वीडियो के लिए) | clip_vision_h.safetensors | ComfyUI/models/clip_vision/ |
वीडियो मॉडल (डिफ्यूजन मॉडल) | से चुनें यह निर्देशिका table2_row4_col2_suffix | ComfyUI/models/diffusion_models/ |
वीडियो मॉडल अनुशंसा:
fp16
> bf16
> fp8_scaled
> fp8_e4m3fn
。ComfyUI JSON-आधारित वर्कफ़्लो प्रदान करता है। आप इन JSON फ़ाइलों को आधिकारिक ComfyUI उदाहरणों या दस्तावेज़ीकरण में पा सकते हैं। यहाँ कुछ वर्कफ़्लो के GIF प्रदर्शन दिए गए हैं:
इस वर्कफ़्लो का उपयोग 1.3B या 14B मॉडल के साथ किया जा सकता है। उदाहरण के लिए, उपयोग करें:
wan2.1_t2v_1.3B_fp16.safetensors
(ComfyUI/models/diffusion_models/
में रखें)आउटपुट: 480p / 720p (चयनित मॉडल और सेटिंग्स पर निर्भर करता है)
रनटाइम: RTX 4090 के साथ 5-सेकंड का 480p वीडियो बनाने में लगभग 4 मिनट लगते हैं।
वर्कफ़्लो उदाहरण (1.3B 480p):
वर्कफ़्लो उदाहरण (14B 720p):
JSON वर्कफ़्लो फ़ाइल:text_to_video_wan.json
इस वर्कफ़्लो के लिए निम्नलिखित फ़ाइलों की आवश्यकता है:
wan2.1_i2v_480p_14B_fp16.safetensors
(ComfyUI/models/diffusion_models/
में रखें)wan2.1_i2v_720p_14B_fp16.safetensors
(ComfyUI/models/diffusion_models/
में रखें)clip_vision_h.safetensors
(ComfyUI/models/clip_vision/
में रखें)आउटपुट: 480p (डिफ़ॉल्ट उदाहरण: 33 फ्रेम @ 512x512) या 720p (यदि VRAM और हार्डवेयर अनुमति देते हैं)।
वर्कफ़्लो उदाहरण (14B 480p):
वर्कफ़्लो उदाहरण (14B 720p):
JSON वर्कफ़्लो फ़ाइल:image_to_video_wan_example.json
umt5_xxl_fp8_e4m3fn_scaled.safetensors
)。umt5_xxl_fp8_e4m3fn_scaled.safetensors
के साथ 480p/720p इमेज-टू-वीडियो मॉडल (जैसे, 14B I2V) चलाने के लिए, आपको लगभग 40GB VRAM की आवश्यकता है।