Tongyi Wanxiang AI वीडियो जनरेशन

Wan 2.5 प्रीव्यू

बहु-संवेदी कहानी कहने में एक क्रांति। नेटिव ऑडियो को सिनेमैटिक-ग्रेड विज़ुअल कंट्रोल के साथ एकीकृत करना, AI वीडियो निर्माण की सीमाओं को फिर से परिभाषित करता है।

क्षमताओं में पीढ़ीगत छलांग

Wan 2.5 पिछले मॉडलों के सार को एकीकृत करता है जबकि प्रमुख आयामों में गुणात्मक सफलताएं प्राप्त करता है।

बहु-संवेदी कहानी कहना

सिंक्रनाइज़्ड ऑडियो-वीडियो प्रोसेसिंग का पहली बार कार्यान्वयन, नेटिव नरेशन, सटीक लिप-सिंक और इमर्सिव पर्यावरणीय ध्वनि प्रभाव प्रदान करता है।

सिनेमैटिक 4K क्वालिटी

4K रिज़ॉल्यूशन आउटपुट तक का समर्थन करता है, जो फोटो-यथार्थवादी चेहरे, त्वचा की बनावट और कपड़ों के विवरण प्रस्तुत करता है जो पेशेवर उत्पादन मानकों को पूरा करते हैं।

सटीक सिनेमैटिक कंट्रोल

पैन, ज़ूम और फ़ोकस स्विचिंग सहित उन्नत कैमरा नियंत्रण प्रदान करता है, जिससे निर्माता केवल 'वर्णन' करने के बजाय दृश्यों को 'निर्देशित' कर सकते हैं।

विस्तारित कथा अवधि

10+ सेकंड तक के वीडियो क्लिप बनाने का समर्थन करता है, जो एक पूर्ण कथा लय या एक छोटे विज्ञापन को बनाने के लिए पर्याप्त है।

विकास पथ: ओपन सोर्स से शिखर तक

Wan 2.5 दिग्गजों के कंधों पर खड़ा है, जो तकनीकी पुनरावृत्ति और रणनीतिक विकास के अपरिहार्य परिणाम का प्रतिनिधित्व करता है।

Wan 2.1 / 2.2

ओपन सोर्स फाउंडेशन

स्थापित सामुदायिक नेतृत्व और लोकप्रिय उच्च-प्रदर्शन वीडियो जनरेशन।


MoE आर्किटेक्चर क्रांति

विशेषज्ञों का मिश्रण आर्किटेक्चर पेश किया, जिससे स्केलेबल मॉडल प्रदर्शन प्राप्त हुआ।

Wan 2.5 प्रीव्यू

क्षमता एकीकरण

ऑडियो, एनीमेशन और उन्नत नियंत्रण को एक एकीकृत मॉडल में एकीकृत करता है।


वाणिज्यिक API

उच्च-स्तरीय पेशेवर बाजार में बदलाव, बंद-स्रोत API सेवाएं प्रदान करता है।

बाजार संरचना को नया आकार देना

Wan 2.5 की रिलीज़ जेनरेटिव वीडियो बाजार के तीन-स्तरीय संरचना के एक नए युग में प्रवेश का प्रतीक है।

स्तर 1: हाई-एंड क्लोज्ड सोर्स

उद्योग बेंचमार्क

शीर्ष प्रयोगशालाओं (OpenAI, Google, Alibaba) द्वारा API एक्सेस के माध्यम से प्रदान किए गए फ्लैगशिप मॉडल, उच्चतम गुणवत्ता और सबसे मजबूत नियंत्रण का पीछा करते हैं।

प्रतिनिधि: Sora, Veo, Wan 2.5

स्तर 2: विरासत ओपन सोर्स

समुदाय का मुख्य आधार

उच्च-गुणवत्ता वाले लेकिन एक पीढ़ी पीछे के ओपन-सोर्स मॉडल, जो सामुदायिक प्रयोग, सीखने और गैर-व्यावसायिक परियोजनाओं के लिए कोर के रूप में काम करते हैं।

प्रतिनिधि: Wan 2.2, Stable Video Diffusion

स्तर 3: स्वतंत्र ओपन सोर्स

नवाचार अग्रणी

समुदाय-संचालित छोटे या विशेष मॉडल जो अनूठी सुविधाएँ प्रदान करते हैं या विशिष्ट हार्डवेयर के लिए अनुकूलित होते हैं, जो पारिस्थितिकी तंत्र की विविधता के स्रोत के रूप में काम करते हैं।

प्रतिनिधि: Community Models

वान मॉडल श्रृंखला की विशेषताओं और वास्तुकला की तुलना

नीचे दी गई तालिका मुख्य वास्तुकला, प्रमुख नवाचारों और रिलीज़ मॉडल की तुलना करके वान मॉडल श्रृंखला के खुले अभिगम्यता से पेशेवर व्यावसायीकरण तक के पूर्ण विकास पथ को सहजता से प्रदर्शित करती है।

कोर आर्किटेक्चरWan 2.1Wan 2.2Wan 2.5 प्रीव्यू (घोषित/अनुमानित)
कोर आर्किटेक्चरमानक डिफ्यूजन ट्रांसफार्मरविशेषज्ञों का मिश्रण (MoE) (उच्च/निम्न शोर)विकसित MoE आर्किटेक्चर
मॉडल स्केल1.3B और 14B पैरामीटर14B सक्रिय / 27B कुल पैरामीटरसंभवतः >30B कुल पैरामीटर
प्रमुख नवाचारओपन सोर्स एक्सेसिबिलिटी और दक्षताMoE स्केलेबल प्रदर्शन प्राप्त करता हैएकीकृत मल्टीमॉडल (ऑडियो-वीडियो)
अधिकतम रिज़ॉल्यूशन720p (अस्थिर), 480p (अनुशंसित)720p / 1080p4K (दावा किया गया), 1080p (API द्वारा पुष्टि)
अधिकतम अवधि~3-5 सेकंड~5 सेकंड10+ सेकंड
कोर मोडैलिटीT2V, I2V, वीडियो संपादनT2V, I2V, और समर्पित S2V और एनिमेट मॉडलएकीकृत T2V, I2V, ऑडियो-वीडियो सिंक, उन्नत एनीमेशन
सिनेमैटिक कंट्रोलबुनियादी"सिनेमैटिक एस्थेटिक कंट्रोल"सटीक कैमरा, प्रकाश व्यवस्था और दृश्य नियंत्रण
रिलीज़ मॉडलओपन सोर्स (Apache 2.0)ओपन सोर्स (Apache 2.0)केवल API (क्लोज्ड सोर्स)