Openai API में फ्लेक्स प्रोसेसिंग का परिचय देता है ताकि डेवलपर्स को AI उपयोग लागत में कटौती करने में मदद मिल सके | Infinium-tech
Openai ने अपने एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (API) के माध्यम से गुरुवार को डेवलपर्स के लिए एक नया सेवा स्तर की शुरुआत की। डब किए गए फ्लेक्स प्रोसेसिंग, यह मानक मूल्य निर्धारण की तुलना में डेवलपर्स के लिए एआई उपयोग की लागत को आधे से कम कर देता है। हालांकि, कम कीमतें धीमी प्रतिक्रिया समय और सामयिक संसाधन अनुपलब्धता के परिणाम के साथ आती हैं। नई एपीआई सुविधा वर्तमान में चुनिंदा तर्क-केंद्रित बड़े भाषा मॉडल (एलएलएम) के लिए बीटा में उपलब्ध है। सैन फ्रांसिस्को स्थित एआई फर्म ने कहा कि यह सेवा टियर गैर-उत्पादन और गैर-प्रायरिटी कार्यों के लिए उपयोगी हो सकता है।
Openai API में नई सेवा टियर जोड़ता है
इसके समर्थन में पेजएआई फर्म ने इस सेवा स्तर को विस्तृत किया। फ्लेक्स प्रोसेसिंग वर्तमान में चैट पूर्णता और प्रतिक्रियाओं एपीआई के लिए बीटा में उपलब्ध है, और ओ 3 और ओ 4-मिनी एआई मॉडल के साथ काम करती है। डेवलपर्स नए मोड को सक्रिय करने के लिए एपीआई अनुरोध में फ्लेक्स करने के लिए सेवा स्तरीय पैरामीटर सेट कर सकते हैं।
सस्ती एपीआई मूल्य निर्धारण का एक नकारात्मक पक्ष यह है कि प्रसंस्करण समय काफी अधिक होगा। Openai का कहना है कि फ्लेक्स प्रोसेसिंग के लिए चुनने वाले डेवलपर्स को धीमी प्रतिक्रिया समय और सामयिक संसाधन अनुपलब्धता की उम्मीद करनी चाहिए। इसके अतिरिक्त, उपयोगकर्ताओं को एपीआई अनुरोध टाइमआउट मुद्दों का भी सामना करना पड़ सकता है, यदि प्रॉम्प्ट लंबा है या अनुरोध जटिल है। एआई फर्म के अनुसार, यह मोड गैर-उत्पादन या कम-प्राथमिकता वाले कार्यों जैसे कि मॉडल मूल्यांकन, डेटा संवर्धन, या एसिंक्रोनस वर्कलोड के लिए सहायक हो सकता है।
विशेष रूप से, OpenAI पर प्रकाश डाला गया है कि डेवलपर्स डिफ़ॉल्ट टाइमआउट को बढ़ाकर टाइमआउट त्रुटियों से बच सकते हैं। डिफ़ॉल्ट रूप से, ये एपीआई 10 मिनट पर टाइमआउट पर सेट होते हैं। हालांकि, फ्लेक्स प्रसंस्करण के साथ, लंबे और जटिल संकेतों से अधिक समय लग सकता है। कंपनी का सुझाव है कि टाइमआउट बढ़ने से त्रुटि होने की संभावना कम हो जाएगी।
इसके अतिरिक्त, फ्लेक्स प्रोसेसिंग में कभी -कभी डेवलपर्स के अनुरोधों को संभालने के लिए संसाधनों की कमी हो सकती है, और इसके बजाय “429 संसाधन अनुपलब्ध” त्रुटि कोड को ध्वजांकित किया जा सकता है। इन परिदृश्यों का प्रबंधन करने के लिए, डेवलपर्स घातीय बैकऑफ़ के साथ अनुरोधों को फिर से कर सकते हैं, या यदि समय पर पूरा होने पर डिफ़ॉल्ट सेवा स्तर पर स्विच कर सकते हैं। Openai ने कहा कि जब वे इस त्रुटि को प्राप्त करते हैं तो यह डेवलपर्स को चार्ज नहीं करेगा।
वर्तमान में, O3 AI मॉडल मानक मोड में $ 10 (लगभग 854 रुपये) प्रति मिलियन इनपुट टोकन और $ 40 (लगभग 3,418 रुपये 3,418) प्रति मिलियन आउटपुट टोकन का शुल्क लेता है। फ्लेक्स प्रोसेसिंग इनपुट लागत को $ 5 (लगभग 427 रुपये) और आउटपुट की लागत $ 20 (लगभग 1,709 रुपये) तक लाती है। इसी तरह, नई सेवा टियर $ 0.55 (लगभग रु।
Leave a Reply