अलीबाबा की क्यूवेन टीम ने QWQ-32B ओपन-सोर्स रीज़निंग मॉडल को रिलीज़ किया, ने दीपसेक-आर 1 के समान प्रदर्शन करने के लिए कहा

07MarMarch 7, 2025

अलीबाबा की क्यूवेन टीम ने QWQ-32B ओपन-सोर्स रीज़निंग मॉडल को रिलीज़ किया, ने दीपसेक-आर 1 के समान प्रदर्शन करने के लिए कहा | Infinium-tech

By infinium-tech Tech & Science News Hindi Infiniumtech, QWQ32B, अलबब, अलीबाबा QWQ 32B ओपन सोर्स रीज़निंग एआई मॉडल डीपसेक आर 1 क्यूवेन टीम ने अलीबाबा को रिलीज़ किया, आपके पास एक मॉडल है, एलएलएम, ऐ, ओपनसरस, क, कय, कयवन, करन, कह, कृत्रिम होशियारी, क्यूवेन, टम, दपसकआर, न, परदरशन, मडल, रजनग, रलज, लए, समन

अलीबाबा की क्यूवेन टीम, एक डिवीजन ने आर्टिफिशियल इंटेलिजेंस (AI) मॉडल विकसित करने का काम सौंपा, ने बुधवार को QWQ-32B AI मॉडल जारी किया। यह एक तर्क मॉडल है जो दृश्य श्रृंखला-की-सोच (COT) के साथ विस्तारित परीक्षण समय गणना पर आधारित है। डेवलपर्स का दावा है कि डीपसेक-आर 1 की तुलना में आकार में छोटा होने के बावजूद, मॉडल बेंचमार्क स्कोर के आधार पर अपने प्रदर्शन से मेल खा सकता है। क्यूवेन टीम द्वारा जारी अन्य एआई मॉडल की तरह, QWQ-32B भी एक ओपन-सोर्स एआई मॉडल है, हालांकि, यह पूरी तरह से खुला नहीं है।

QWQ-32B तर्क AI मॉडल जारी किया

में एक ब्लॉग भेजाअलीबाबा की क्यूवेन टीम ने QWQ-32B रीजनिंग मॉडल को विस्तृत किया। QWQ (प्रश्नों के साथ Qwen के लिए छोटा) श्रृंखला AI मॉडल पहली बार कंपनी द्वारा नवंबर 2024 में पेश किए गए थे। इन तर्क मॉडल को Openai की O1 श्रृंखला की पसंद के लिए एक ओपन-सोर्स विकल्प की पेशकश करने के लिए डिज़ाइन किया गया था। QWQ-32B एक 32 बिलियन पैरामीटर मॉडल है जिसे स्केलिंग सुदृढीकरण लर्निंग (RL) तकनीकों द्वारा विकसित किया गया है।

प्रशिक्षण प्रक्रिया की व्याख्या करते हुए, डेवलपर्स ने कहा कि आरएल स्केलिंग दृष्टिकोण को कोल्ड-स्टार्ट चेकपॉइंट में जोड़ा गया था। प्रारंभ में, आरएल का उपयोग केवल कोडिंग और गणित से संबंधित कार्यों के लिए किया गया था, और सटीकता सुनिश्चित करने के लिए प्रतिक्रियाओं को सत्यापित किया गया था। बाद में तकनीक का उपयोग नियम-आधारित वेरिफायर के साथ सामान्य क्षमताओं के लिए किया गया था। क्यूवेन टीम ने पाया कि इस पद्धति ने अपने गणित और कोडिंग प्रदर्शन को कम किए बिना मॉडल की सामान्य क्षमताओं में वृद्धि की।

QWQ-32B AI मॉडल बेंचमार्क
फोटो क्रेडिट: अलीबाबा

डेवलपर्स का दावा है कि इन प्रशिक्षण संरचनाओं ने QWQ-32B को दीपसेक-आर 1 के समान स्तरों पर प्रदर्शन करने में सक्षम बनाया, जो बाद में 671-बिलियन-पैरामीटर मॉडल (37 बिलियन सक्रिय के साथ) होने के बावजूद। आंतरिक परीक्षण के आधार पर, टीम ने दावा किया कि QWQ-32B लाइवबेंच (कोडिंग), IFEVAL (चैट या इंस्ट्रक्शन फाइन-ट्यून्ड भाषा), और बर्कले फ़ंक्शन कॉलिंग लीडरबोर्ड V3 या BFCL (कॉल करने की क्षमता) बेंचमार्क में QWQ-32B डीपसेक-आर 1 से बेहतर प्रदर्शन करता है।

डेवलपर्स और एआई के उत्साही लोग फेस लिस्टिंग और मॉडलस्कोप को हग करने पर मॉडल के खुले वजन को पा सकते हैं। मॉडल Apache 2.0 लाइसेंस के तहत उपलब्ध है जो अकादमिक और अनुसंधान से संबंधित उपयोग की अनुमति देता है लेकिन वाणिज्यिक उपयोग के मामलों को मना करता है। इसके अतिरिक्त, चूंकि पूर्ण प्रशिक्षण विवरण और डेटासेट उपलब्ध नहीं हैं, इसलिए मॉडल भी प्रतिकृति नहीं है या इसे डिकंस्ट्रक्ट किया जा सकता है। दीपसेक-आर 1 भी उसी लाइसेंस के तहत उपलब्ध था।

यदि किसी के पास स्थानीय रूप से एआई मॉडल को चलाने के लिए सही हार्डवेयर का अभाव है, तो वे क्यूवेन चैट के माध्यम से इसकी क्षमताओं का भी उपयोग कर सकते हैं। पृष्ठ के शीर्ष-बाएं पर मॉडल पिकर मेनू उपयोगकर्ताओं को QWQ-32B-PREVIEW मॉडल का चयन करने देगा।

Credits : gadgets360