क्रांतिकारी AI वीडियो इंजन: एक मॉडल, वीडियो निर्माण, संपादन और पुनर्रचना के लिए।
Wan2.1-VACE केवल वीडियो निर्माण से कहीं ज़्यादा है; यह एक संपूर्ण वीडियो निर्माण सहयोगी है। इसका एकल मॉडल आर्किटेक्चर आपको वीडियो पर अभूतपूर्व नियंत्रण प्रदान करता है।
टेक्स्ट विवरण या एकल छवियों से एकदम नई वीडियो सामग्री बनाएं, अपनी कल्पना को गतिशील दृश्यों में बदलें।
मौजूदा वीडियो पर गहन संपादन करें, जिसमें शैली हस्तांतरण, ऑब्जेक्ट प्रतिस्थापन, पृष्ठभूमि विस्तार आदि शामिल हैं, जो पुराने फुटेज को नया जीवन देते हैं।
विभिन्न उपकरणों के बीच स्विच करने की कोई आवश्यकता नहीं है। Wan2.1-VACE अपनी एकीकृत वास्तुकला के साथ निर्माण से लेकर संपादन तक सभी वीडियो प्रसंस्करण कार्यों को कुशलतापूर्वक पूरा करता है।
Wan2.1-VACE आपको वीडियो के प्रत्येक फ्रेम पर बारीक नियंत्रण प्रदान करता है, जिससे आपकी रचनात्मकता मुक्त हो जाती है।
क्रिया, मुद्रा, दिशा, सब आपके नियंत्रण में।
लेआउट, गति प्रक्षेपवक्र, स्वतंत्र रूप से सेट करें।
वीडियो शैली, समग्र रूप और अनुभव, अपनी इच्छानुसार अनुकूलित करें।
आपकी विविध निर्माण आवश्यकताओं को पूरा करने के लिए लचीले ढंग से संयुक्त कई इनपुट विधियों का समर्थन करता है।
Wan2.1-VACE की शक्ति इसके कार्यों के लचीले संयोजन में निहित है, जो जटिल निर्माण मांगों को आसानी से संभालती है।
एक ऊर्ध्वाधर छवि को आसानी से एक क्षैतिज लंबे वीडियो में बदलने के लिए "छवि संदर्भ + पृष्ठभूमि विस्तार + अवधि विस्तार" को मिलाएं, जिसमें बुद्धिमानी से भरा हुआ सामंजस्यपूर्ण पृष्ठभूमि हो।
वीडियो में केवल विशिष्ट वस्तुओं को बदलने के लिए "संदर्भ छवि + स्थानीय इनपेंटिंग" को मिलाएं, जबकि अन्य तत्वों को पूरी तरह से संरक्षित करते हुए, निर्बाध संपादन प्राप्त करें।
Wan2.1-VACE मॉडल के बारे में सामान्य प्रश्नों के उत्तर यहां पाएं।
Wan2.1-VACE अलीबाबा वान-एआई लैब द्वारा विकसित एक ओपन-सोर्स मल्टीमॉडल वीडियो जनरेशन और एडिटिंग फाउंडेशनल मॉडल है। यह टेक्स्ट-टू-वीडियो (T2V), इमेज-टू-वीडियो (I2V), वीडियो-टू-वीडियो (V2V) एडिटिंग, रेफरेंस-गाइडेड जनरेशन (R2V), और मास्क्ड वीडियो एडिटिंग (MV2V) जैसे विभिन्न जटिल कार्यों का समर्थन करने वाली एक एकीकृत वास्तुकला को नियोजित करता है।
"ऑल इन वन, वान फॉर ऑल" Wan2.1-VACE का मुख्य डिजाइन दर्शन है। "ऑल इन वन" इसके एकल मॉडल आर्किटेक्चर को संदर्भित करता है जो टूल स्विच करने की आवश्यकता के बिना कई वीडियो निर्माण और संपादन कार्यों को संभालने में सक्षम है। "वान फॉर ऑल" इसकी समावेशिता पर जोर देता है, जो उपयोगकर्ताओं की एक विस्तृत श्रृंखला को ओपन सोर्स और उपभोक्ता-ग्रेड हार्डवेयर के समर्थन के माध्यम से उन्नत एआई वीडियो तकनीक तक पहुंचने और उसका उपयोग करने में सक्षम बनाता है।
मुख्य विशेषताओं में शामिल हैं:
इसके दो मुख्य संस्करण हैं: Wan2.1-VACE-1.3B और Wan2.1-VACE-14B।
Wan2.1-VACE-1.3B: लगभग 1.3 बिलियन मापदंडों वाला एक हल्का संस्करण। मुख्य रूप से 480p रिज़ॉल्यूशन वाले वीडियो का समर्थन करता है और उपभोक्ता-ग्रेड GPU के अनुकूल है (उदाहरण के लिए, T2V अनुमान के लिए लगभग 8.19GB VRAM की आवश्यकता होती है)। व्यक्तिगत रचनाकारों और तेजी से प्रोटोटाइप बनाने के लिए उपयुक्त है।
Wan2.1-VACE-14B: लगभग 14 बिलियन मापदंडों वाला एक बड़ा पैरामीटर स्केल संस्करण। 480p और उच्च गुणवत्ता वाले 720p रिज़ॉल्यूशन वाले वीडियो का समर्थन करता है। मजबूत प्रदर्शन प्रदान करता है लेकिन इसमें उच्च हार्डवेयर आवश्यकताएं होती हैं (उदाहरण के लिए, I2V अनुमान के लिए लगभग 35GB VRAM की आवश्यकता होती है)। पेशेवर वीडियो उत्पादन और उच्च-गुणवत्ता वाली सामग्री निर्माण के लिए उपयुक्त है।
हां, Wan2.1-VACE अपाचे 2.0 ओपन सोर्स लाइसेंस के तहत लाइसेंस प्राप्त है।
आप निम्नलिखित मुख्य चैनलों से मॉडल और कोड प्राप्त कर सकते हैं:
बुनियादी आवश्यकताओं में शामिल हैं:
विस्तृत सेटअप चरणों में आमतौर पर रिपॉजिटरी को क्लोन करना, निर्भरताएँ स्थापित करना और मॉडल वेट डाउनलोड करना शामिल होता है।
आवेदन की संभावनाएं व्यापक हैं, जिनमें शामिल हैं: