डीपसीक का कहना है कि उसका नया रीज़निंग-केंद्रित डीपसीक-आर1 एआई मॉडल ओपनएआई के ओ1 से बेहतर प्रदर्शन कर सकता है | Infinium-tech
चीनी फर्म डीपसीक द्वारा तर्क-केंद्रित कृत्रिम बुद्धिमत्ता (एआई) मॉडल डीपसीक-आर1 सोमवार को जारी किया गया। यह ओपन सोर्स एआई मॉडल का पूर्ण संस्करण है, जो इसके पूर्वावलोकन संस्करण जारी होने के दो महीने बाद आता है। ओपन-सोर्स एआई मॉडल डाउनलोड करने के लिए उपलब्ध है, और इसे प्लग-एंड-प्ले एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) के रूप में भी इस्तेमाल किया जा सकता है। चीनी एआई फर्म ने दावा किया कि डीपसीक-आर1 गणित, कोडिंग और तर्क-आधारित कार्यों के लिए कई बेंचमार्क में ओपनएआई के ओ1 मॉडल से बेहतर प्रदर्शन करने में सक्षम था।
डीपसीक-आर1 एआई मॉडल की कीमत ओपनएआई के ओ1 से 95 प्रतिशत तक कम है
नवीनतम श्रृंखला में दो वेरिएंट हैं – डीपसीक-आर1 और डीपसीक-आर1-जीरो। दोनों को एआई फर्म द्वारा विकसित एक अन्य बड़े भाषा मॉडल (एलएलएम) से डिस्टिल्ड किया गया है, जिसे डीपसीक वी3 कहा जाता है। नए एआई मॉडल विशेषज्ञों के मिश्रण (एमओई) आर्किटेक्चर पर आधारित हैं, जहां बड़े मॉडल की दक्षता और क्षमताओं में सुधार के लिए कई छोटे मॉडलों को एक साथ जोड़ा जाता है।
डीपसीक-आर1 एआई मॉडल वर्तमान में इसके हगिंग फेस के माध्यम से डाउनलोड करने के लिए उपलब्ध हैं प्रविष्टि. मॉडल एमआईटी लाइसेंस के साथ आता है जो अकादमिक और व्यावसायिक उपयोग दोनों की अनुमति देता है। जो लोग स्थानीय स्तर पर एलएलएम चलाने का इरादा नहीं रखते हैं, वे मॉडल एपीआई का विकल्प चुन सकते हैं बजाय. कंपनी ने मॉडल के अनुमानित मूल्य की घोषणा की, जिसमें बताया गया कि इनकी लागत OpenAI के o1 से 90-95 प्रतिशत कम है।
वर्तमान में, डीपसीक-आर1 एपीआई प्रति मिलियन टोकन $0.14 (लगभग 12.10 रुपये) के इनपुट मूल्य के साथ आता है और आउटपुट मूल्य $2.19 (लगभग 189.50 रुपये) प्रति मिलियन टोकन पर सेट है। इसकी तुलना में, OpenAI के o1 API की लागत प्रति मिलियन इनपुट टोकन $7.5 (लगभग 649 रुपये) और प्रति मिलियन आउटपुट टोकन $60 (लगभग 5,190 रुपये) है।
न केवल डीपसीक-आर1 की कीमत कम है, बल्कि कंपनी का यह भी दावा है कि यह ओपनएआई समकक्ष की तुलना में उच्च प्रदर्शन प्रदान करता है। आंतरिक परीक्षण के आधार पर, एआई फर्म ने कहा कि डीपसीक-आर1 ने अमेरिकी आमंत्रण गणित परीक्षा (एआईएमई), गणित-500 और एसडब्ल्यूई-बेंच बेंचमार्क में ओ1 से बेहतर प्रदर्शन किया। हालाँकि, मॉडलों के बीच अंतर मामूली है।
प्रशिक्षण के बाद की बात करें तो कंपनी ने कहा कि उसने बिना किसी पर्यवेक्षित फाइन-ट्यूनिंग (एसएफटी) के आधार मॉडल में सुदृढीकरण सीखने (आरएल) का उपयोग किया। यह विधि, जिसे शुद्ध आरएल के रूप में भी जाना जाता है, चेन-ऑफ-थॉट (सीओटी) तंत्र का उपयोग करके जटिल समस्याओं को हल करते समय मॉडल को अधिक स्वतंत्रता की अनुमति देती है। डीपसीक ने दावा किया कि तर्क क्षमताओं में सुधार के लिए शुद्ध आरएल का उपयोग करने वाला यह पहला ओपन-सोर्स एआई प्रोजेक्ट है।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए गैजेट्स 360 को फ़ॉलो करें एक्स, फेसबुक, WhatsApp, धागे और गूगल समाचार. गैजेट और तकनीक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें यूट्यूब चैनल. यदि आप शीर्ष प्रभावशाली व्यक्तियों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस को फ़ॉलो करें वह360 कौन है? पर Instagram और यूट्यूब.
iPhone 17 के बैक पैनल का डिज़ाइन फिर हुआ लीक; पिक्सेल जैसा रियर कैमरा मॉड्यूल दिखाता है
Leave a Reply