Google सार्वभौमिक AI सहायक के लिए विजन, प्रोजेक्ट एस्ट्रा और प्रोजेक्ट मेरिनर का विस्तार करता है | Infinium-tech
Google ने मंगलवार को I/O 2025 में आर्टिफिशियल इंटेलिजेंस (AI) अपडेट और नई सुविधाओं की भीड़ की घोषणा की। साथ ही, कंपनी ने एआई के साथ अपनी दीर्घकालिक दृष्टि भी साझा की, और जिस तरह से वह एआई उत्पादों की अपनी वर्तमान लाइन को विकसित करना चाहता है। Google डीपमाइंड के सह-संस्थापक और सीईओ डेमिस हसाबिस ने प्रोजेक्ट एस्ट्रा और प्रोजेक्ट मेरिनर के साथ नए विकास के साथ-साथ जेमिनी रोबोटिक्स के साथ टेक दिग्गजों की योजनाओं पर प्रकाश डाला। Google ने कहा कि यह अंततः एक सार्वभौमिक एआई सहायक का निर्माण करना चाहता है।
प्रोजेक्ट एस्ट्रा, मेरिनर उपयोगकर्ताओं का चयन करने के लिए रोल कर रहा है
में एक ब्लॉग भेजाहसाबिस ने एक सार्वभौमिक एआई सहायक बनाने के लिए कंपनी के दृष्टिकोण पर प्रकाश डाला। इस सहायक को “अधिक सामान्य और अधिक उपयोगी प्रकार के एआई” के रूप में वर्णित किया गया है, जो उपयोगकर्ता के संदर्भ को समझ सकता है, कार्यों को लगातार योजना बना सकता है, और उनकी ओर से, उपकरणों पर कार्रवाई कर सकता है। जबकि यह Google डीपमाइंड की एक दीर्घकालिक परियोजना है, प्रोजेक्ट एस्ट्रा और प्रोजेक्ट मेरिनर में नई क्षमताओं के साथ एक महत्वपूर्ण कदम उठाया गया था।
प्रोजेक्ट एस्ट्रा मिथुन मॉडल की वास्तविक समय की क्षमताओं से संबंधित है। इन सुविधाओं की पहली लहर को मिथुन लाइव के लिए रोल आउट किया गया है, जो अब डिवाइस के कैमरे तक पहुंच सकता है और वास्तविक समय में स्क्रीन पर सामग्री को पढ़ सकता है। परियोजना ने अब देशी ऑडियो पीढ़ी के साथ अधिक प्राकृतिक-ध्वनि वाली आवाज के लिए वॉयस आउटपुट को अपडेट किया है। इसके अतिरिक्त, यह बेहतर मेमोरी और कंप्यूटर नियंत्रण क्षमताओं को भी जोड़ रहा है।
Google I/O 2025 के मुख्य सत्र के दौरान दिखाए गए एक डेमो में, उन्नत मिथुन लाइव उपयोगकर्ता से स्पष्ट रूप से बात कर सकता है, बाधित हो सकता है और बातचीत को फिर से शुरू कर सकता है, जहां से यह छोड़ दिया, और पृष्ठभूमि में एक साथ कई कार्यों का प्रदर्शन किया। कंप्यूटर नियंत्रण के साथ, इसने व्यवसायों को कॉल भी किया, एक दस्तावेज़ के माध्यम से स्क्रॉल किया, और वेब खोजकर जानकारी पाई।
इन सुविधाओं को वर्तमान में कंपनी द्वारा परीक्षण किया जा रहा है और अंततः मिथुन लाइव, खोज में एआई मोड, और लाइव एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) में जोड़ा जाएगा। इसे स्मार्ट ग्लास जैसे नए फॉर्म कारकों में भी जोड़ा जाएगा।
अगला प्रोजेक्ट मेरिनर है, जो मिथुन में एजेंट क्षमताओं को विकसित करता है। इसे दिसंबर 2024 में लॉन्च किया गया था, और Google मानव-एजेंट सिस्टम के विभिन्न शोध प्रोटोटाइप की खोज कर रहा है। कंपनी ने एक ब्राउज़र-केंद्रित एआई एजेंट का भी पूर्वावलोकन किया जो एक रेस्तरां और पुस्तक नियुक्तियों में आरक्षण कर सकता है।
Google ने कहा कि प्रोजेक्ट मेरिनर में अब एजेंटों की एक प्रणाली शामिल है जो एक साथ 10 अलग -अलग कार्यों को पूरा कर सकते हैं। इनका उपयोग उत्पादों को खरीदने और ऑनलाइन अनुसंधान करने के लिए भी किया जा सकता है। ये अद्यतन क्षमताएं अब अमेरिका में Google AI अल्ट्रा ग्राहकों को उपलब्ध कराई जा रही हैं।
मिथुन एपीआई का उपयोग करने वाले डेवलपर्स को भी इसकी कंप्यूटर उपयोग क्षमताएं मिलेंगी। इसके अतिरिक्त, डीपमाइंड भी इस साल के अंत में इन क्षमताओं को और अधिक उत्पादों में लाना चाहता है।
मिथुन रोबोटिक्स और विश्व मॉडल
मुख्य सत्र के दौरान, Google ने विश्व मॉडल के बारे में भी बात की। ये अनिवार्य रूप से बहुत शक्तिशाली फाउंडेशन एआई मॉडल हैं जिनमें वास्तविक दुनिया के भौतिकी और स्थानिक बुद्धिमत्ता का गहरा ज्ञान है। इन मॉडलों को सिमुलेशन के माध्यम से प्रशिक्षण रोबोट के लिए आदर्श माना जाता है।
Google ने कहा कि वह अपने मिथुन रोबोटिक्स डिवीजन के लिए मिथुन 2.0 मॉडल का उपयोग कर रहा है, जो कि ह्यूमनॉइड और गैर-ह्यूमनॉइड रोबोट को प्रशिक्षित करने और विकसित करने के लिए एक मंच है। वर्तमान में, यह अपने विश्वसनीय परीक्षकों के साथ मंच का परीक्षण कर रहा है।
Leave a Reply