अलीबाबा की क्यूवेन टीम ने QWQ-32B ओपन-सोर्स रीज़निंग मॉडल को रिलीज़ किया, ने दीपसेक-आर 1 के समान प्रदर्शन करने के लिए कहा | Infinium-tech
अलीबाबा की क्यूवेन टीम, एक डिवीजन ने आर्टिफिशियल इंटेलिजेंस (AI) मॉडल विकसित करने का काम सौंपा, ने बुधवार को QWQ-32B AI मॉडल जारी किया। यह एक तर्क मॉडल है जो दृश्य श्रृंखला-की-सोच (COT) के साथ विस्तारित परीक्षण समय गणना पर आधारित है। डेवलपर्स का दावा है कि डीपसेक-आर 1 की तुलना में आकार में छोटा होने के बावजूद, मॉडल बेंचमार्क स्कोर के आधार पर अपने प्रदर्शन से मेल खा सकता है। क्यूवेन टीम द्वारा जारी अन्य एआई मॉडल की तरह, QWQ-32B भी एक ओपन-सोर्स एआई मॉडल है, हालांकि, यह पूरी तरह से खुला नहीं है।
QWQ-32B तर्क AI मॉडल जारी किया
में एक ब्लॉग भेजाअलीबाबा की क्यूवेन टीम ने QWQ-32B रीजनिंग मॉडल को विस्तृत किया। QWQ (प्रश्नों के साथ Qwen के लिए छोटा) श्रृंखला AI मॉडल पहली बार कंपनी द्वारा नवंबर 2024 में पेश किए गए थे। इन तर्क मॉडल को Openai की O1 श्रृंखला की पसंद के लिए एक ओपन-सोर्स विकल्प की पेशकश करने के लिए डिज़ाइन किया गया था। QWQ-32B एक 32 बिलियन पैरामीटर मॉडल है जिसे स्केलिंग सुदृढीकरण लर्निंग (RL) तकनीकों द्वारा विकसित किया गया है।
प्रशिक्षण प्रक्रिया की व्याख्या करते हुए, डेवलपर्स ने कहा कि आरएल स्केलिंग दृष्टिकोण को कोल्ड-स्टार्ट चेकपॉइंट में जोड़ा गया था। प्रारंभ में, आरएल का उपयोग केवल कोडिंग और गणित से संबंधित कार्यों के लिए किया गया था, और सटीकता सुनिश्चित करने के लिए प्रतिक्रियाओं को सत्यापित किया गया था। बाद में तकनीक का उपयोग नियम-आधारित वेरिफायर के साथ सामान्य क्षमताओं के लिए किया गया था। क्यूवेन टीम ने पाया कि इस पद्धति ने अपने गणित और कोडिंग प्रदर्शन को कम किए बिना मॉडल की सामान्य क्षमताओं में वृद्धि की।
QWQ-32B AI मॉडल बेंचमार्क
फोटो क्रेडिट: अलीबाबा
डेवलपर्स का दावा है कि इन प्रशिक्षण संरचनाओं ने QWQ-32B को दीपसेक-आर 1 के समान स्तरों पर प्रदर्शन करने में सक्षम बनाया, जो बाद में 671-बिलियन-पैरामीटर मॉडल (37 बिलियन सक्रिय के साथ) होने के बावजूद। आंतरिक परीक्षण के आधार पर, टीम ने दावा किया कि QWQ-32B लाइवबेंच (कोडिंग), IFEVAL (चैट या इंस्ट्रक्शन फाइन-ट्यून्ड भाषा), और बर्कले फ़ंक्शन कॉलिंग लीडरबोर्ड V3 या BFCL (कॉल करने की क्षमता) बेंचमार्क में QWQ-32B डीपसेक-आर 1 से बेहतर प्रदर्शन करता है।
डेवलपर्स और एआई के उत्साही लोग फेस लिस्टिंग और मॉडलस्कोप को हग करने पर मॉडल के खुले वजन को पा सकते हैं। मॉडल Apache 2.0 लाइसेंस के तहत उपलब्ध है जो अकादमिक और अनुसंधान से संबंधित उपयोग की अनुमति देता है लेकिन वाणिज्यिक उपयोग के मामलों को मना करता है। इसके अतिरिक्त, चूंकि पूर्ण प्रशिक्षण विवरण और डेटासेट उपलब्ध नहीं हैं, इसलिए मॉडल भी प्रतिकृति नहीं है या इसे डिकंस्ट्रक्ट किया जा सकता है। दीपसेक-आर 1 भी उसी लाइसेंस के तहत उपलब्ध था।
यदि किसी के पास स्थानीय रूप से एआई मॉडल को चलाने के लिए सही हार्डवेयर का अभाव है, तो वे क्यूवेन चैट के माध्यम से इसकी क्षमताओं का भी उपयोग कर सकते हैं। पृष्ठ के शीर्ष-बाएं पर मॉडल पिकर मेनू उपयोगकर्ताओं को QWQ-32B-PREVIEW मॉडल का चयन करने देगा।
Leave a Reply