Google I/O 2025: GEMINI 2.5 AI मॉडल डीप थिंक मोड, देशी ऑडियो आउटपुट के साथ अपग्रेड किए गए | Infinium-tech
Google ने मंगलवार को Google I/O 2025 में आर्टिफिशियल इंटेलिजेंस (AI) मॉडल के मिथुन 2.5 फैमिली के लिए कई नई सुविधाएँ दिखाईं। माउंटेन व्यू-आधारित टेक दिग्गज ने डीप थिंक डब किए गए एक बढ़ी हुई रीज़निंग मोड की शुरुआत की, जो कि मिथुन 2.5 प्रो मॉडल द्वारा संचालित है। इसने देशी ऑडियो आउटपुट नामक एक नए, प्राकृतिक और मानव-जैसे भाषण का भी अनावरण किया, जो लाइव एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) के माध्यम से उपलब्ध होगा। इसके अतिरिक्त, कंपनी डेवलपर्स के लिए नवीनतम मिथुन मॉडल के साथ विचार सारांश और सोच बजट भी ला रही है।
GEMINA 2.5 प्रो रैंक Lmarena लीडरबोर्ड के शीर्ष पर
में एक ब्लॉग भेजाटेक दिग्गज ने सभी नई क्षमताओं और सुविधाओं को विस्तृत किया है जो अगले कुछ महीनों में मिथुन 2.5 एआई मॉडल श्रृंखला के लिए शिपिंग होगी। इस महीने की शुरुआत में, Google ने बेहतर कोडिंग क्षमताओं के साथ मिथुन 2.5 प्रो का एक अद्यतन संस्करण जारी किया। अपडेटेड मॉडल भी WebDev Arena और Lmarena लीडरबोर्ड पर शीर्ष स्थान पर है।
अब, Google डीप थिंक मोड के साथ एआई मॉडल में और सुधार कर रहा है। नया रीज़निंग मोड मिथुन 2.5 प्रो को जवाब देने से पहले कई परिकल्पनाओं पर विचार करने की अनुमति देता है। कंपनी का कहना है कि यह पुराने मॉडलों के सोच संस्करणों की तुलना में एक अलग शोध तकनीक का उपयोग करता है।
आंतरिक परीक्षण के आधार पर, टेक दिग्गज ने विभिन्न मापदंडों में रीज़निंग मोड के बेंचमार्क स्कोर को साझा किया। विशेष रूप से, मिथुन 2.5 प्रो डीप थिंक को 2025 UAMO पर 49.4 प्रतिशत स्कोर करने का दावा किया गया है, जो सबसे कठिन गणित बेंचमार्क परीक्षणों में से एक है। यह LiveCodebench V6 और MMMU पर प्रतिस्पर्धी रूप से स्कोर करता है।
डीप थिंक वर्तमान में परीक्षण के अधीन है, और Google का कहना है कि यह सुरक्षा मूल्यांकन कर रहा है और सुरक्षा विशेषज्ञों से इनपुट प्राप्त कर रहा है। वर्तमान में, तर्क मोड केवल मिथुन एपीआई के माध्यम से विश्वसनीय परीक्षकों के लिए उपलब्ध है। इसकी रिलीज की तारीख पर कोई शब्द नहीं है।
Google ने मिथुन 2.5 फ्लैश मॉडल में नई क्षमताओं को जोड़ने की भी घोषणा की, जो एक महीने पहले ही जारी किया गया था। कंपनी ने कहा कि तर्क, मल्टीमॉडलिटी, कोड और लंबे संदर्भ के लिए एआई मॉडल के प्रमुख बेंचमार्क में सुधार किया गया है। इसके अतिरिक्त, यह भी अधिक कुशल है और 20-30 प्रतिशत कम टोकन का उपयोग करता है, कंपनी ने दावा किया।
मिथुन 2.5 फ्लैश का यह नया संस्करण वर्तमान में Google AI स्टूडियो के माध्यम से डेवलपर्स के पूर्वावलोकन में उपलब्ध है। उद्यम इसे वर्टेक्स एआई प्लेटफॉर्म के माध्यम से एक्सेस कर सकते हैं, और व्यक्ति इसे मिथुन ऐप में पा सकते हैं। विशेष रूप से, मॉडल जून में उत्पादन के लिए व्यापक रूप से उपलब्ध होगा।
लाइव एपीआई तक पहुंचने वाले डेवलपर्स को अब एआई मॉडल की मिथुन 2.5 श्रृंखला के साथ एक नई सुविधा मिलेगी। कंपनी देशी ऑडियो आउटपुट का एक पूर्वावलोकन संस्करण पेश कर रही है, जो अधिक अभिव्यंजक और मानव-जैसे तरीके से भाषण उत्पन्न कर सकती है। Google ने कहा कि सुविधा उपयोगकर्ताओं को टोन, उच्चारण और भाषण की शैली को नियंत्रित करने की अनुमति देती है।
क्षमता का प्रारंभिक संस्करण तीन सुविधाओं के साथ आता है। पहले स्नेहपूर्ण संवाद है, जहां एआई मॉडल उपयोगकर्ता की आवाज में भावनाओं का पता लगा सकता है और तदनुसार प्रतिक्रिया दे सकता है। दूसरा प्रोएक्टिव ऑडियो है, जो मॉडल को पृष्ठभूमि वार्तालापों को अनदेखा करने में सक्षम बनाता है और केवल तभी जवाब देता है जब इसे बोला जाता है। और अंत में, सोच, जो भाषण पीढ़ी को मौखिक रूप से जटिल प्रश्नों का उत्तर देने के लिए मिथुन की सोच क्षमताओं का लाभ उठाता है।
इसके अलावा, मिथुन एपीआई और वर्टेक्स एआई में 2.5 प्रो और फ्लैश मॉडल भी विचार सारांश दिखाएंगे। ये अनिवार्य रूप से मॉडल की कच्ची विचार प्रक्रिया हैं, जो पहले केवल मिथुन के तर्क मॉडल में दिखाई दे रहे थे। अब, Google हर प्रतिक्रिया के साथ मॉडल क्रियाओं के बारे में हेडर, प्रमुख विवरण और जानकारी सहित एक विस्तृत सारांश दिखाएगा।
आने वाले हफ्तों में, डेवलपर्स भी मिथुन 2.5 प्रो के साथ सोच बजट का उपयोग करने में सक्षम होंगे। यह उन्हें यह तय करने की अनुमति देगा कि जवाब देने से पहले एक मॉडल कितने टोकन की खपत करता है। अंत में, प्रोजेक्ट मेरिनर के कंप्यूटर उपयोग एजेंट फंक्शन को भी एपीआई और वर्टेक्स एआई में जल्द ही जोड़ा जाएगा।
Leave a Reply