2025 में एआई एजेंट: वे क्या हैं और वे दुनिया भर के उद्योगों में कैसे क्रांति ला सकते हैं | Infinium-tech
जनरेटिव आर्टिफिशियल इंटेलिजेंस (एआई) की नवीनता खत्म होने के बाद, कई लोगों ने एक महत्वपूर्ण सवाल उठाया – हां यह अच्छा है, लेकिन यह वास्तविक दुनिया में कैसे प्रभाव डाल सकता है? यह एक वैध प्रश्न था. जबकि एआई चैटबॉट्स को त्वरित रूप से जानकारी देखने, तत्काल बातचीत करने, निबंध लिखने, चित्र या वीडियो बनाने के लिए वन-स्टॉप-शॉप के रूप में देखा जा सकता है, उनकी भूमिका काफी हद तक एक प्रणाली तक सीमित है जहां एक मानव उपयोगकर्ता को लगातार काम करना होगा इसे आउटपुट प्राप्त करने और परिणाम की निगरानी करने का आदेश दें।
भले ही इसकी क्षमताओं को खारिज नहीं किया जा सकता है, और इसने कुछ क्षेत्रों में श्रमिकों की उत्पादकता में सुधार करने में महत्वपूर्ण प्रभाव डाला है, लेकिन इसमें एक महत्वपूर्ण तत्व की कमी है जिसने इसे एक वफादार सहायक बनने से रोक दिया है जो कार्यों को संभाल सकता है और वास्तव में स्वचालित कर सकता है – निर्णय लेना। जेनरेटिव एआई आज किसी व्यक्ति के काम के कुछ पहलुओं में मदद कर सकता है, लेकिन यह किसी कार्य को निष्पादित नहीं कर सकता है।
उदाहरण के लिए, आप इसे किसी ग्राहक को अप्रत्याशित देरी के बारे में बताने के लिए एक ईमेल लिखने के लिए कह सकते हैं, लेकिन यह उस संदेश को नहीं भेज सकता है या उनके द्वारा भेजे गए गुस्से वाले उत्तर से निपट नहीं सकता है। इसी तरह, आप “वीडियो शूट करने के लिए सबसे अच्छा स्मार्टफोन” मांगने के लिए जेमिनी या चैटजीपीटी का उपयोग कर सकते हैं, और यह नवीनतम आईफोन 16 प्रो मैक्स या सैमसंग गैलेक्सी एस24 अल्ट्रा की सिफारिश कर सकता है। लेकिन यह आपके लिए सबसे अच्छा सौदा ढूंढ़ने और खरीदारी करने के लिए वेब पर खोजबीन करने में सक्षम नहीं होगा।
इस अंतर को महसूस करते हुए, बड़े भाषा मॉडल (एलएलएम) पर काम करने वाली तकनीकी कंपनियों ने एआई एजेंट शब्द का उपयोग करना शुरू कर दिया। शोधकर्ताओं का मानना है कि एआई एजेंट ज्ञान-आधारित एआई सिस्टम ले सकते हैं और इसे एक कार्रवाई करने वाली प्रणाली में बदल सकते हैं जो मानव हस्तक्षेप के बिना अंत-से-अंत कार्य कर सकता है।
इस शब्द को 2024 की दूसरी छमाही के दौरान प्रमुखता मिली और वर्तमान में, इसे काम से संबंधित सभी समस्याओं के लिए रामबाण माना जा रहा है। और जबकि इसमें कुछ सच्चाई है, क्या यह वास्तव में उस क्षमता की परिवर्तनकारी तकनीक है? उत्तर थोड़ा जटिल हो सकता है, लेकिन हम इसे तोड़ने और उन सभी विभिन्न पहलुओं पर प्रकाश डालने की पूरी कोशिश करेंगे जिनके बारे में आपको जानना चाहिए। आइए हम इसमें गोता लगाएँ।
एआई एजेंट क्या है?
चूँकि यह तकनीक अभी भी अपने प्रारंभिक चरण में है, इसलिए AI एजेंट का वास्तव में क्या गठन होता है इसकी कोई एकीकृत परिभाषा नहीं है। आईबीएम को परिभाषित करता है यह एक ऐसी प्रणाली है जो वर्कफ़्लो डिज़ाइन करके और टूल का उपयोग करके उपयोगकर्ता की ओर से कार्यों को स्वायत्त रूप से निष्पादित करने में सक्षम है। इसी तरह, Google, जिसने पिछले साल प्रोजेक्ट मेरिनर नामक अपने पहले एआई एजेंट की घोषणा की थी, इसे एक ऐसी प्रणाली कहता है जो मनुष्यों के लिए सहायक की तरह काम करती है और उन्हें कार्यों को पूरा करने में मदद करती है।
अमेज़ॅन द्वारा एक अधिक व्यापक परिभाषा दी गई है, जो का वर्णन करता है यह “एक सॉफ्टवेयर प्रोग्राम है जो अपने पर्यावरण के साथ बातचीत कर सकता है, डेटा एकत्र कर सकता है, और पूर्व निर्धारित लक्ष्यों को पूरा करने के लिए स्व-निर्धारित कार्यों को करने के लिए डेटा का उपयोग कर सकता है।” मनुष्य लक्ष्य निर्धारित करता है, लेकिन एक एआई एजेंट स्वतंत्र रूप से उन लक्ष्यों को प्राप्त करने के लिए आवश्यक सर्वोत्तम कार्यों को चुनता है।
सीधे शब्दों में कहें तो एआई एजेंट को एक एआई सिस्टम के रूप में समझा जा सकता है जो उपयोगकर्ता को कार्रवाई के बारे में बताने के बजाय कार्रवाई कर सकता है।
एआई एजेंट को तोड़ना
एक विशिष्ट एआई एजेंट के मस्तिष्क के रूप में एक बड़ा भाषा मॉडल (एलएलएम) होगा। लेकिन इसमें अन्य तत्व भी शामिल होंगे जो इसे कार्यों में उस बुद्धिमत्ता का उपयोग करने में सक्षम बनाते हैं। आमतौर पर, ये अतिरिक्त भाग विभिन्न सेंसर, यांत्रिक भाग, एनकोडर या अन्य सॉफ़्टवेयर में एकीकरण होते हैं।
सेंसर एआई एजेंट को विभिन्न प्रारूपों में डेटा एकत्र करने में सक्षम बनाते हैं। ये दृश्य, ध्वनि, तापमान या इलेक्ट्रॉनिक सिग्नल हो सकते हैं। यांत्रिक भागों का उपयोग आम तौर पर सन्निहित एआई या रोबोट के लिए किया जाता है जिन्हें वास्तविक दुनिया की गतिविधियों को निष्पादित करने की आवश्यकता होती है जैसे कि किसी वस्तु को उठाना या एक स्थान से दूसरे स्थान पर जाना। एनकोडर का उपयोग विभिन्न प्रकार के संकेतों को सूचना में परिवर्तित करने के लिए किया जाता है जिन्हें एलएलएम द्वारा संसाधित किया जा सकता है। अंत में, सॉफ़्टवेयर एकीकरण कार्यों को निष्पादित करने की क्षमता सक्षम बनाता है।
इस बिंदु पर एआई मॉडल और एआई एजेंटों के बीच एक और महत्वपूर्ण अंतर को उजागर करना भी महत्वपूर्ण है। एआई मॉडल में एक पूर्व-प्रशिक्षण डेटाबेस होता है जो उनके ज्ञान का आधार बनता है। जो कुछ भी डेटाबेस का हिस्सा नहीं है वह आउटपुट उत्पन्न नहीं करेगा। इसका एक अच्छा उदाहरण चैटजीपीटी का प्रारंभिक संस्करण था जो इंटरनेट से जुड़ा नहीं था और इसमें ज्ञान की अंतिम तिथि थी। यदि उसे समसामयिक मामलों के बारे में किसी प्रश्न का उत्तर देने के लिए कहा जाए, तो वह उसका उत्तर नहीं दे पाएगा।
इसके विपरीत, एआई एजेंट, जब प्रासंगिक प्रणालियों के साथ एकीकृत होते हैं, तो उन समस्याओं को हल करने के लिए स्वतंत्र रूप से नया डेटा एकत्र कर सकते हैं जो उनके मौजूदा डेटाबेस के आधार पर संभव नहीं होगा। उदाहरण के लिए, Google का प्रोजेक्ट मेरिनर कर सकता है इंटरैक्ट करना स्मार्टवॉच पर सर्वोत्तम डील खोजने के लिए ब्राउज़र का उपयोग करें।
एआई एजेंटों का एक अन्य पहलू जटिल कार्यों को संभालने की क्षमता है। एआई एजेंट उन्नत तर्क करने में सक्षम हैं और इस तरह एक जटिल कार्य को कई आसान कार्यों में तोड़ सकते हैं और फिर उन्हें एक के बाद एक पूरा कर सकते हैं। समस्या की यह प्रासंगिक समझ और इसे कैसे हल किया जाए यह जानने की क्षमता एआई एजेंटों का एक मौलिक कार्य है।
इसका एक अच्छा उदाहरण जेमिनी का हाल ही में जोड़ा गया डीप रिसर्च टूल है। उपयोगकर्ता इससे किसी तकनीकी या विशिष्ट विषय को समझाने के लिए कह सकते हैं। इसके बाद एआई एक बहु-चरणीय अनुसंधान योजना तैयार करेगा, विषय को छोटे भागों में तोड़ देगा, विषय पर प्रासंगिक शोध पत्र और लेख ढूंढेगा, योजना को क्रियान्वित करेगा, अनुसंधान करेगा और एक विस्तृत रिपोर्ट बनाने के लिए एकत्रित डेटा का विश्लेषण करेगा।
एआई एजेंटों के अनुप्रयोग
एआई कंपनियां एआई एजेंटों को एक ऐसे उपकरण के रूप में पेश कर रही हैं जिसका उपयोग उद्योगों और विभिन्न परिदृश्यों में किया जा सकता है। इसका उपयोग उन उपकरणों के लिए ध्वनि सहायक के रूप में किया जा सकता है जो डिवाइस-विशिष्ट कार्य (जैसे चित्र लेना या संगीत बजाना) कर सकते हैं। इसे किसी ऐप या सॉफ़्टवेयर में जोड़ा जा सकता है और उसके भीतर कार्य किए जा सकते हैं (ब्राउज़र-आधारित एजेंट के माध्यम से उत्पाद खरीदना)। इसे एंटरप्राइज सिस्टम में भी जोड़ा जा सकता है और यह धोखाधड़ी का पता लगा सकता है या विभिन्न प्रक्रियाओं को अनुकूलित करने के तरीके ढूंढ सकता है।
इसके अलावा, एआई एजेंटों को कुछ उद्योगों में परिवर्तनकारी कार्य करने के लिए भी कहा जाता है। स्वास्थ्य देखभाल में, इसका उपयोग निदान, उपचार की सिफारिश और दवा की खोज के लिए किया जा सकता है। ऑटोमोटिव सेक्टर में इसका इस्तेमाल सेल्फ-ड्राइविंग कारें बनाने में किया जा सकता है। यह भी कहा जाता है कि एआई एजेंट आपदा क्षेत्रों में डेटा इकट्ठा करने और उसका विश्लेषण करने और बचाव कार्यों के लिए कार्रवाई योग्य अंतर्दृष्टि प्रदान करने के लिए ड्रोन चलाने में सक्षम हैं।
इसमें एआई-पावर्ड रोबोट के माध्यम से विनिर्माण उद्योगों में, गेमिंग उद्योग में गेम डेवलपर के रूप में या गेम के अंदर एक गैर-प्लेइंग कैरेक्टर (एनपीसी) के रूप में और शिक्षा क्षेत्र में वैयक्तिकृत अध्ययन योजनाएं बनाने और परीक्षण पत्रों को ग्रेड करने के लिए भी आवेदन हैं। एक इंसान जैसा फैशन.
हालाँकि, यह ध्यान रखना महत्वपूर्ण है कि जबकि टेक कंपनियां सभी प्रकार के एंड-टू-एंड इंटेलिजेंट ऑटोमेशन के लिए एआई एजेंटों को कैच-ऑल के रूप में विपणन कर रही हैं, वर्तमान तकनीक इसके उपयोग के मामले को सामान्य के बजाय बड़े पैमाने पर विशिष्ट कार्य-आधारित भूमिकाओं तक सीमित करती है। -प्रयोजन उपकरण.
2025 में एआई एजेंट
जैसा कि कहा गया है, हमारी अपेक्षाओं को पूरा करना और यह समझना महत्वपूर्ण है कि चालू वर्ष में हम एआई एजेंटों से वास्तविक रूप से क्या उम्मीद कर सकते हैं। यह संभावना नहीं है कि एआई एजेंट विनिर्माण, ऑटोमोबाइल, स्वास्थ्य सेवा या शिक्षा जैसे किसी भी महत्वपूर्ण क्षेत्र में कार्यबल में प्रवेश करेंगे।
हालाँकि, इस वर्ष उपभोक्ता इलेक्ट्रॉनिक्स, मोबाइल और डेस्कटॉप अनुप्रयोगों के साथ-साथ वेबसाइटों और प्लेटफार्मों में एआई एजेंटों के प्रवेश को चिह्नित किया जाना चाहिए। उदाहरण के लिए, Google के प्रोजेक्ट मेरिनर को Google Chrome के साथ एकीकृत किया जा सकता है और इस वर्ष के अंत तक उपयोगकर्ताओं को खरीदारी करने और वेब से फ़ाइलें ढूंढने में सहायता मिल सकती है।
ऐसी अफवाह है कि ओपनएआई इस साल अपना एआई एजेंट लॉन्च कर सकता है जो चैटजीपीटी की क्षमताओं को और बढ़ा सकता है और इसे उपयोगकर्ता के डिवाइस और इंटरनेट पर कुछ कार्य करने की अनुमति दे सकता है। एंथ्रोपिक के कंप्यूटर उपयोग टूल के वैश्विक रिलीज होने और डिवाइस पर उपयोगकर्ताओं को उनके दैनिक कार्यों में सहायता करने की भी उम्मीद है।
अंततः, हमें एक बदलाव भी देखना चाहिए जहां एआई एजेंट कीस्ट्रोक्स, माउस मूवमेंट और क्लिक की नकल कर सकते हैं और उपकरणों पर बहुत कुछ कर सकते हैं। उदाहरण के लिए, वर्ष के अंत तक, कोडिंग एजेंट डेविन जैसे अधिक एजेंटिक उपकरण एंड-टू-एंड कोड लिख सकते हैं, उनका परीक्षण कर सकते हैं, गड़बड़ियां ढूंढ सकते हैं और उन्हें ठीक कर सकते हैं, और उन्हें मानवीय हस्तक्षेप के बिना तैनात कर सकते हैं। लेकिन, इसे 2025 के यात्रा कार्यक्रम में शामिल करना बेहद आशावादी होगा।
उद्यम पक्ष पर, एआई एजेंट कुछ संगठनात्मक कार्यों को पूरा करने में बड़ी भूमिका निभा सकते हैं जैसे बड़ी मात्रा में डेटा की निगरानी करना, विश्लेषणात्मक रिपोर्ट तैयार करना और सिफारिशें और पाठ्यक्रम सुधार की पेशकश करना। इसका उपयोग कुछ साइबर सुरक्षा भूमिकाओं में भी किया जा सकता है। विशेष रूप से, मेटा ने कहा है कि दिशानिर्देशों का पालन सुनिश्चित करने के लिए वह पहले से ही एआई का उपयोग करता है। YouTube कॉपीराइट उल्लंघनों की निगरानी के लिए भी AI का उपयोग करता है।
हालाँकि, हम उम्मीद नहीं करते हैं कि एआई एजेंट इस वर्ष किसी भी महत्वपूर्ण कार्य कार्य में प्रवेश करेंगे क्योंकि प्रौद्योगिकी काफी हद तक अप्रयुक्त है और इसकी विश्वसनीयता संदिग्ध होगी। व्यवसाय, विशेष रूप से सार्वजनिक उद्यम या बड़े निवेशकों द्वारा समर्थित व्यवसाय, आम तौर पर जोखिम-प्रतिरोधी होते हैं और संवेदनशील डेटा तक पहुंच प्रदान करने की संभावना नहीं होती है।
एआई एजेंटों के साथ समस्याएं
तकनीकी क्षेत्र में एआई का वर्तमान रुझान और बड़ी संख्या में उद्योगों को बाधित करने की क्षमता के साथ, यह समझ में आता है कि एआई एजेंटों के बारे में इतना उत्साह क्यों है। हालाँकि, गुलाबी रंग के चश्मे से परे एआई एजेंटों के साथ कई मुद्दे मौजूद हैं जिन्हें प्रौद्योगिकी को बड़े पैमाने पर अपनाने से पहले संबोधित करने की आवश्यकता है। दूसरी ओर, यदि यह अनियंत्रित हो जाता है, तो प्रौद्योगिकी कई जोखिम पैदा कर सकती है।
एआई एजेंटों के साथ मुख्य मुद्दों में से एक पूर्वाग्रह और भेदभाव है जो उनके प्रशिक्षण डेटा से आता है और भेदभावपूर्ण परिणामों को जन्म दे सकता है। यह एआई एजेंटों में पारदर्शिता के एक अन्य मुद्दे पर भी प्रकाश डालता है। जटिल एल्गोरिदम और वास्तुकला के साथ, अधिकांश एआई एजेंट जटिल और अपारदर्शी सिस्टम हैं जहां यह समझना मुश्किल है कि वे कुछ निर्णय कैसे और क्यों लेते हैं।
सुरक्षा और गोपनीयता के मुद्दे भी हैं। सुरक्षा के दृष्टिकोण से, एआई एजेंट प्रतिकूल हमलों के प्रति संवेदनशील हो सकते हैं, जहां दुर्भावनापूर्ण अभिनेता सिस्टम को धोखा देने के लिए इनपुट डेटा में हेरफेर करते हैं। इसके अतिरिक्त, चूंकि एआई एजेंटों को कार्यों को पूरा करने के लिए कई प्रणालियों से जुड़ने और बड़ी मात्रा में डेटा एकत्र करने की आवश्यकता होती है, इसलिए वे गोपनीयता जोखिम भी पैदा करते हैं।
इतनी सारी चुनौतियों के साथ, एआई फर्मों को उद्यमों और व्यक्तियों को प्रौद्योगिकी के फायदे के बारे में समझाने और नुकसान के बारे में आश्वस्त करने के लिए एक कठिन काम करना होगा। बावजूद इसके, इस बात से इनकार नहीं किया जा सकता कि 2025 में एआई घोषणाओं में एआई एजेंट एक बड़ा हिस्सा होंगे।
Leave a Reply