एआय एजंट कसा तयार करायचा

एआय एजंट कसा तयार करायचा

थोडक्यात उत्तर: प्रत्यक्षात काम करणारा एआय एजंट तयार करण्यासाठी, त्याला नियंत्रित लूप म्हणून हाताळा: इनपुट घ्या, पुढील कृती ठरवा, एका अरुंद व्याप्ती असलेल्या टूलला कॉल करा, निकालाचे निरीक्षण करा आणि स्पष्ट "पूर्ण" तपासणी होईपर्यंत पुनरावृत्ती करा. जेव्हा कार्य बहु-चरण आणि टूल-चालित असते तेव्हा ते त्याचे रक्षण करते; जर एकाच प्रॉम्प्टने ते सोडवले तर एजंट वगळा. कठोर टूल स्कीमा, स्टेप लिमिट्स, लॉगिंग आणि व्हॅलिडेटर/क्रिटिक जोडा जेणेकरून जेव्हा टूल्स अयशस्वी होतात किंवा इनपुट अस्पष्ट असतात तेव्हा एजंट लूपिंगऐवजी वाढतो.

महत्वाचे मुद्दे:

कंट्रोलर लूप : स्पष्ट स्टॉप कंडिशन आणि कमाल पायऱ्यांसह इनपुट→अ‍ॅक्ट→रिपीटेशनचे निरीक्षण करा.

टूल डिझाइन : "काहीही करा" गोंधळ टाळण्यासाठी टूल्स अरुंद, टाइप केलेले, परवानगी असलेले आणि प्रमाणित ठेवा.

मेमरी हायजिन : कॉम्पॅक्ट शॉर्ट-टर्म स्टेट आणि दीर्घकालीन रिट्रीव्हल वापरा; पूर्ण ट्रान्सक्रिप्ट्स डंप करणे टाळा.

गैरवापर प्रतिकार : धोकादायक कृतींसाठी अनुमती यादी, दर मर्यादा, अयोग्यता आणि "ड्राय-रन" जोडा.

चाचणीक्षमता : परिस्थितीचा संच (अपयश, अस्पष्टता, इंजेक्शन) ठेवा आणि प्रत्येक बदल पुन्हा चालवा.

एआय एजंट कसा तयार करायचा? इन्फोग्राफिक
या लेखानंतर तुम्हाला वाचायला आवडतील असे लेख:

🔗 एआय कामगिरी कशी मोजायची
वेग, अचूकता आणि विश्वासार्हता यांचे बेंचमार्क करण्यासाठी व्यावहारिक मेट्रिक्स शिका.

🔗 एआयशी कसे बोलावे
चांगली उत्तरे मिळविण्यासाठी सूचना, संदर्भ आणि फॉलो-अप वापरा.

🔗 एआय मॉडेल्सचे मूल्यांकन कसे करावे
चाचण्या, रूब्रिक्स आणि वास्तविक-जगातील कार्य परिणाम वापरून मॉडेल्सची तुलना करा.

🔗 एआय मॉडेल्स कसे ऑप्टिमाइझ करायचे
ट्यूनिंग, छाटणी आणि देखरेखीसह गुणवत्ता आणि खर्च सुधारा.


१) सामान्य माणसाच्या भाषेत, एआय एजंट म्हणजे काय 🧠

एआय एजंट हा एक लूप असतो. लँगचेन “एजंट्स” डॉक्स

बस्स. मध्यभागी मेंदू असलेला एक लूप.

इनपुट → विचार → कृती → निरीक्षण → पुनरावृत्ती करा . पुनर्अभिक्रिया पेपर (कारण + कृती)

कुठे:

  • इनपुट म्हणजे वापरकर्त्याची विनंती किंवा कार्यक्रम (नवीन ईमेल, सपोर्ट तिकीट, सेन्सर पिंग).

  • विचार करणे हे पुढील पायरीबद्दल तर्क करणारे एक भाषा मॉडेल आहे.

  • कायदा म्हणजे एक साधन कॉल करणे (अंतर्गत दस्तऐवज शोधा, कोड चालवा, तिकीट तयार करा, उत्तर मसुदा तयार करा). ओपनएआय फंक्शन कॉलिंग मार्गदर्शक

  • ऑब्झर्व्ह टूल आउटपुट वाचत आहे.

  • रिपीट हा असा भाग आहे जो "चॅटी" ऐवजी "एजेंटिक" वाटतो. लँगचेन "एजंट" डॉक्स

काही एजंट मुळात स्मार्ट मॅक्रो असतात. काही जण ज्युनियर ऑपरेटरसारखे काम करतात जे कामे व्यवस्थित करू शकतात आणि चुकांमधून सावरू शकतात. दोन्हीही महत्त्वाचे आहेत.

तसेच, तुम्हाला पूर्ण स्वायत्ततेची आवश्यकता नाही. खरं तर... तुम्हाला कदाचित ते नको असेल 🙃


२) तुम्ही एजंट कधी तयार करावा (आणि कधी करू नये) 🚦

एजंट तयार करा जेव्हा:

  • हे काम अनेक टप्प्यांचे आणि मध्यभागी काय होते यावर अवलंबून बदलते.

  • या कामासाठी टूल्सचा वापर (डेटाबेस, सीआरएम, कोड एक्झिक्युशन, फाइल जनरेशन, ब्राउझर, अंतर्गत एपीआय). लँगचेन “टूल्स” डॉक्स

  • तुम्हाला रेलिंगसह पुनरावृत्ती करता येणारे निकाल

  • तुम्ही "पूर्ण" ची व्याख्या संगणक तपासू शकेल अशा पद्धतीने करू शकता, अगदी सैल पद्धतीने देखील.

एजंट तयार करू नका जेव्हा:

  • एक साधा प्रॉम्प्ट + रिस्पॉन्स याने समस्या सोडवता येते (अतिरिक्त काम करू नका, नंतर तुम्हाला स्वतःचा द्वेष होईल).

  • तुम्हाला परिपूर्ण निश्चयवादाची आवश्यकता आहे (एजंट सुसंगत असू शकतात, परंतु रोबोटिक नाहीत).

  • तुमच्याकडे कनेक्ट करण्यासाठी कोणतेही टूल्स किंवा डेटा नाही - मग ते बहुतेक फक्त व्हायब्स आहे.

चला स्पष्टपणे सांगूया: "एआय एजंट प्रोजेक्ट्स" पैकी अर्धे भाग काही ब्रँचिंग नियमांसह वर्कफ्लो असू शकतात. पण अरे, कधीकधी व्हाइब देखील महत्त्वाचा असतो 🤷♂️


३) एआय एजंटची चांगली आवृत्ती कशामुळे बनते ✅

तुम्ही मागितलेला "चांगला व्हर्जन कशामुळे होतो" हा विभाग येथे आहे, मी थोडे स्पष्टपणे सांगेन:

एआय एजंटची चांगली आवृत्ती नसते जी सर्वात कठीण विचार करते. ती अशी असते जी:

जर तुमच्या एजंटची चाचणी घेतली जाऊ शकत नसेल, तर ती मुळात एक अतिशय आत्मविश्वासू स्लॉट मशीन आहे. पार्ट्यांमध्ये मजा, निर्मितीमध्ये भयानक 😬


४) एजंटचे मुख्य घटक ("शरीरशास्त्र" 🧩)

बहुतेक सॉलिड एजंट्समध्ये हे तुकडे असतात:

अ) कंट्रोलर लूप 🔁

हा वाद्यवृंद आहे:

  • ध्येय घ्या

  • पुढील कृतीसाठी मॉडेलला विचारा

  • रन टूल

  • निरीक्षण जोडा

  • पूर्ण होईपर्यंत पुन्हा करा लँगचेन “एजंट्स” डॉक्स

ब) साधने (म्हणजे क्षमता) 🧰

साधने ही एजंटला प्रभावी बनवतात: लँगचेन “टूल्स” डॉक्स

  • डेटाबेस क्वेरी

  • ईमेल पाठवणे

  • फायली ओढणे

  • रनिंग कोड

  • अंतर्गत API कॉल करणे

  • स्प्रेडशीट किंवा सीआरएमवर लिहिणे

क) स्मृती 🗃️

दोन प्रकारचे महत्त्व:

  • अल्पकालीन स्मृती : सध्याच्या धावपळीचा संदर्भ, अलीकडील पावले, सध्याची योजना

  • दीर्घकालीन स्मृती : वापरकर्त्याची प्राधान्ये, प्रकल्प संदर्भ, मिळवलेले ज्ञान (बहुतेकदा एम्बेडिंगद्वारे + वेक्टर स्टोअरद्वारे) RAG पेपर

ड) नियोजन आणि निर्णय धोरण 🧭

जरी तुम्ही त्याला "नियोजन" म्हणत नसलात तरी, तुम्हाला एक पद्धत आवश्यक आहे:

ई) रेलिंग आणि मूल्यांकन 🧯

हो, ते प्रॉम्प्टिंगपेक्षा जास्त इंजिनिअरिंग आहे. जे... मुद्दा थोडासा महत्त्वाचा आहे.


५) तुलना सारणी: एजंट तयार करण्याचे लोकप्रिय मार्ग 🧾

खाली एक वास्तववादी "तुलना सारणी" आहे - काही वैशिष्ट्यांसह, कारण खरे संघ विचित्र असतात 😄

साधन / फ्रेमवर्क प्रेक्षक किंमत ते का काम करते नोट्स (लहान गोंधळ)
लँगचेन लेगो-शैलीतील घटकांना आवडणारे बांधकाम व्यावसायिक फ्री-इश + इन्फ्रा साधने, स्मृती, साखळ्यांसाठी मोठी परिसंस्था जर तुम्ही गोष्टी स्पष्टपणे सांगितल्या नाहीत तर स्पॅगेटीसारखे जलद होऊ शकते
लामाइंडेक्स आरएजी-हेवी संघ फ्री-इश + इन्फ्रा मजबूत पुनर्प्राप्ती नमुने, अनुक्रमणिका, कनेक्टर जेव्हा तुमचा एजंट मुळात "शोध + कृती" करतो तेव्हा उत्तम... जे सामान्य आहे
ओपनएआय असिस्टंट्स शैलीचा दृष्टिकोन जलद सेटअप हवे असलेले संघ वापर-आधारित अंगभूत टूल कॉलिंग पॅटर्न आणि रन स्टेट काही कोपऱ्यांमध्ये कमी लवचिक, परंतु अनेक अॅप्ससाठी स्वच्छ ओपनएआय एपीआय ओपनएआय असिस्टंट्स फंक्शन कॉलिंग
सिमेंटिक कर्नल संरचित ऑर्केस्ट्रेशन हवे असलेले विकासक मुक्त मनाचा कौशल्ये/कार्यांसाठी सुरेख अमूर्तता "उद्योग नीटनेटका" वाटतो - कधीकधी ते कौतुकास्पद असते 😉
ऑटोजेन मल्टी-एजंट प्रयोगकर्ते मुक्त मनाचा एजंट-टू-एजंट सहयोग नमुने जास्त बोलू शकतो; कडक समाप्तीचे नियम सेट करा
क्रूएआय "एजंटांच्या टीम" चे चाहते मुक्त मनाचा भूमिका + कामे + हँडऑफ व्यक्त करणे सोपे आहे जेव्हा कामे मऊ नसून, चपखल असतात तेव्हा उत्तम काम करते
गवताची गंजी शोध + पाइपलाइन लोक मुक्त मनाचा घन पाइपलाइन, पुनर्प्राप्ती, घटक "एजंट थिएटर" कमी, "प्रॅक्टिकल फॅक्टरी" जास्त
स्वतःचे रोल करा (कस्टम लूप) नियंत्रण करणारे (प्रेमळ) तुमचा वेळ किमान जादू, जास्तीत जास्त स्पष्टता सहसा सर्वोत्तम दीर्घकालीन... जोपर्यंत तुम्ही सर्वकाही पुन्हा शोधत नाही तोपर्यंत 😅

एकही विजेता नाही. तुमच्या एजंटचे मुख्य काम पुनर्प्राप्ती , साधन अंमलबजावणी , बहु-एजंट समन्वय किंवा वर्कफ्लो ऑटोमेशन .


६) एआय एजंट कसा तयार करायचा ते चरण-दर-चरण (प्रत्यक्ष कृती) 🍳🤖

हा भाग बहुतेक लोक वगळतात, मग विचार करतात की एजंट पेंट्रीमध्ये रॅकूनसारखा का वागतो.

पायरी १: एका वाक्यात कामाची व्याख्या करा 🎯

उदाहरणे:

  • "धोरण आणि तिकिट संदर्भ वापरून ग्राहकाचे उत्तर तयार करा, नंतर मंजुरीसाठी विचारा."

  • "बग रिपोर्ट तपासा, तो पुन्हा तयार करा आणि दुरुस्त्या सुचवा."

  • "अपूर्ण बैठकीच्या नोट्सना कार्ये, मालक आणि अंतिम मुदतींमध्ये बदला."

जर तुम्ही ते सोप्या पद्धतीने परिभाषित करू शकत नसाल, तर तुमचा एजंटही करू शकत नाही. म्हणजे ते करू शकते, पण ते सुधारेल, आणि सुधारणेमुळे बजेट संपते.

पायरी २: स्वायत्तता पातळी निश्चित करा (कमी, मध्यम, मसालेदार) 🌶️

  • कमी स्वायत्तता : पावले सुचवते, मानवी क्लिक "मंजूर" करतात.

  • माध्यम : साधने चालवते, आउटपुट तयार करते, अनिश्चिततेवर वाढते

  • उच्च : एंड-टू-एंड कार्यान्वित करते, फक्त अपवादांवर मानवांना पिंग करते.

तुम्हाला हव्या त्यापेक्षा कमी सुरुवात करा. तुम्ही नंतर कधीही ते वाढवू शकता.

पायरी ३: तुमची मॉडेल स्ट्रॅटेजी निवडा 🧠

तुम्ही सामान्यतः निवडता:

  • प्रत्येक गोष्टीसाठी एक मजबूत मॉडेल (सोपे)

  • स्वस्त पायऱ्यांसाठी एक मजबूत मॉडेल + लहान मॉडेल (वर्गीकरण, रूटिंग)

  • आवश्यक असल्यास विशेष मॉडेल्स (दृष्टी, कोड, भाषण)

हे देखील ठरवा:

  • कमाल टोकन

  • तापमान

  • तुम्ही अंतर्गतरित्या दीर्घ तर्कशुद्धतेला परवानगी देता का (तुम्ही हे करू शकता, परंतु अंतिम वापरकर्त्यांसमोर कच्च्या विचारांची साखळी उघड करू नका)

पायरी ४: कठोर स्कीमासह टूल्स परिभाषित करा 🔩

साधने अशी असावीत:

do_anything(input: string) नावाच्या टूलऐवजी , हे बनवा:

  • search_kb(क्वेरी: स्ट्रिंग) -> निकाल[]

  • तिकीट तयार करा (शीर्षक: स्ट्रिंग, मुख्य भाग: स्ट्रिंग, प्राधान्य: एनम) -> तिकीट_आयडी

  • send_email(to: string, subject: string, body: string) -> status OpenAI फंक्शन कॉलिंग मार्गदर्शक

जर तुम्ही एजंटला चेनसॉ दिला तर तो कुंपण काढून कुंपण कापेल तेव्हा आश्चर्यचकित होऊ नका.

पायरी ५: कंट्रोलर लूप तयार करा 🔁

किमान लूप:

  1. ध्येय + प्रारंभिक संदर्भाने सुरुवात करा

  2. मॉडेलला विचारा: "पुढील कृती?"

  3. जर टूल कॉल केला तर - टूल एक्झिक्युट करा

  4. निरीक्षण जोडा

  5. थांब्याची स्थिती तपासा

  6. पुनरावृत्ती करा (जास्तीत जास्त पायऱ्यांसह) लँगचेन “एजंट” डॉक्स

जोडा:

पायरी ६: मेमरी काळजीपूर्वक जोडा 🗃️

अल्पकालीन: प्रत्येक टप्प्यावर एक संक्षिप्त "स्थिती सारांश" अद्यतनित ठेवा. लँगचेन "मेमरी ओव्हरव्यू"
दीर्घकालीन: टिकाऊ तथ्ये साठवा (वापरकर्ता प्राधान्ये, संस्थेचे नियम, स्थिर दस्तऐवज).

अंगठ्याचा नियम:

  • जर ते वारंवार बदलत असेल तर - ते अल्पकालीन ठेवा

  • जर ते स्थिर असेल तर - दीर्घकाळ साठवा

  • जर ते संवेदनशील असेल तर - कमीत कमी साठवा (किंवा अजिबात नाही)

पायरी ७: व्हॅलिडेशन आणि "क्रिटिक" पास जोडा 🧪

एक स्वस्त, व्यावहारिक नमुना:

  • एजंट निकाल निर्माण करतो

  • व्हॅलिडेटर रचना आणि मर्यादा तपासतो

  • गहाळ पावले किंवा धोरण उल्लंघनांसाठी पर्यायी समीक्षक मॉडेल पुनरावलोकने NIST AI RMF 1.0

परिपूर्ण नाही, पण त्यात धक्कादायक प्रमाणात मूर्खपणा आढळतो.

पायरी ८: लॉग इन न केल्याबद्दल तुम्हाला पश्चात्ताप होईल अशा सर्व गोष्टी लॉग करा 📜

लॉग:

भविष्य - तुम्ही तुमचे आभार मानाल. वर्तमान - तुम्ही विसराल. हेच तर आयुष्य आहे 😵💫


७) असे साधन जे तुमच्या आत्म्याला तोडणार नाही 🧰😵

टूल कॉलिंग म्हणजे "एआय एजंट कसा तयार करायचा" हे खरे सॉफ्टवेअर अभियांत्रिकी बनते.

साधने विश्वासार्ह बनवा (विश्वासार्ह असणे चांगले)

विश्वासार्ह साधने अशी आहेत:

टूल लेयरवर फक्त प्रॉम्प्ट्सच नाही तर रेलिंग जोडा

सूचना विनम्र सूचना आहेत. टूल व्हॅलिडेशन हे एक लॉक केलेले दार आहे. ओपनएआय स्ट्रक्चर्ड आउटपुट

करा:

  • अनुमती यादी (कोणती साधने चालू शकतात)

  • इनपुट प्रमाणीकरण

  • दर मर्यादा ओपनएआय दर मर्यादा मार्गदर्शक

  • प्रति वापरकर्ता/संस्था परवानगी तपासणी

  • धोकादायक कृतींसाठी "ड्राय-रन मोड"

आंशिक अपयशासाठी डिझाइन

साधने बिघडली. नेटवर्क डळमळीत झाले. ऑथेशन कालबाह्य झाले. एजंटने हे करणे आवश्यक आहे:

एक शांतपणे प्रभावी युक्ती: संरचित त्रुटी परत करा जसे की:

  • प्रकार: auth_error

  • प्रकार: सापडले नाही

  • प्रकार: rate_limited
    म्हणजे मॉडेल घाबरण्याऐवजी हुशारीने प्रतिसाद देऊ शकेल.


८) तुम्हाला त्रास देण्याऐवजी मदत करणारी आठवण 👻🗂️

स्मरणशक्ती शक्तिशाली असते, पण ती रद्दीचा डबा देखील बनू शकते.

अल्पकालीन स्मृती: ती संक्षिप्त ठेवा

वापरा:

  • शेवटचे N टप्पे

  • चालू सारांश (प्रत्येक लूप अपडेट केला जातो)

  • सध्याची योजना

  • सध्याच्या अडचणी (बजेट, वेळ, धोरणे)

जर तुम्ही सर्वकाही संदर्भात टाकले तर तुम्हाला मिळेल:

  • जास्त खर्च

  • हळू विलंब

  • अधिक गोंधळ (हो, तरीही)

दीर्घकालीन स्मृती: "स्टफिंग" वरून पुनर्प्राप्ती

बहुतेक "दीर्घकालीन स्मृती" यासारखी असते:

  • एम्बेडिंग्ज

  • वेक्टर स्टोअर

  • पुनर्प्राप्ती संवर्धित पिढी (RAG) RAG पेपर

एजंट लक्षात ठेवत नाही. तो रनटाइमवर सर्वात संबंधित स्निपेट पुनर्प्राप्त करतो. LlamaIndex “RAG ची ओळख”

व्यावहारिक स्मृतीचे नियम

  • "प्राधान्ये" ही स्पष्ट तथ्ये म्हणून साठवा: "वापरकर्त्याला बुलेट सारांश आवडतात आणि इमोजी आवडत नाहीत" (हाहा, इथे नाहीये 😄)

  • "निर्णय" टाइमस्टॅम्प किंवा आवृत्त्यांसह साठवा (अन्यथा विरोधाभास जमा होतात)

  • खरोखर गरज असल्याशिवाय कधीही गुपिते साठवू नका

आणि इथे माझा अपूर्ण उपमा आहे: स्मृती ही रेफ्रिजरेटरसारखी आहे. जर तुम्ही ती कधीही स्वच्छ केली नाही, तर शेवटी तुमच्या सँडविचला कांद्यासारखे आणि पश्चात्तापासारखे चव येईल.


९) नियोजन नमुने (सोप्या ते फॅन्सीपर्यंत) 🧭✨

नियोजन म्हणजे फक्त नियंत्रित विघटन. ते गूढ बनवू नका.

नमुना अ: चेकलिस्ट प्लॅनर ✅

  • मॉडेल चरणांची यादी दर्शविते

  • चरण-दर-चरण कार्यान्वित करते

  • चेकलिस्टची स्थिती अपडेट करते

ऑनबोर्डिंगसाठी उत्तम. सोपे, चाचणी करण्यायोग्य.

पॅटर्न बी: ​​रिएक्ट लूप (कारण + कृती) 🧠→🧰

  • मॉडेल पुढील टूल कॉल ठरवते

  • आउटपुटचे निरीक्षण करते

  • ReAct पेपरची पुनरावृत्ती करतो

ही क्लासिक एजंटची भावना आहे.

नमुना क: पर्यवेक्षक-कार्यकर्ता 👥

जेव्हा कार्ये समांतर करता येतात किंवा जेव्हा तुम्हाला वेगवेगळ्या "भूमिका" हव्या असतात जसे की:

  • संशोधक

  • कोडर

  • संपादक

  • QA तपासक

पॅटर्न डी: पुनर्नियोजनासह योजना करा-नंतर-अंमलात आणा 🔄

  • योजना तयार करा

  • अंमलात आणणे

  • जर साधनाच्या परिणामांमुळे वास्तव बदलले तर पुन्हा नियोजन करा

हे एजंटला वाईट योजनेचे अनुसरण करण्यापासून रोखते. मानव देखील हे करतात, जोपर्यंत ते थकलेले नसतात, अशा परिस्थितीत ते देखील वाईट योजनांचे अनुसरण करतात.


१०) सुरक्षितता, विश्वासार्हता आणि नोकरीवरून काढून टाकले जाणार नाही 🔐😅

जर तुमचा एजंट कारवाई करू शकत असेल, तर तुम्हाला सुरक्षा डिझाइनची आवश्यकता आहे. "असणे छान" नाही. गरज आहे. NIST AI RMF 1.0

कठोर मर्यादा

  • प्रति धाव कमाल पावले

  • प्रति मिनिट जास्तीत जास्त टूल कॉल

  • प्रति सत्र कमाल खर्च (टोकन बजेट)

  • मंजुरीमागे प्रतिबंधित साधने

डेटा हाताळणी

  • लॉगिंग करण्यापूर्वी संवेदनशील इनपुट संपादित करा

  • वेगळे वातावरण (डेव्हलपमेंट विरुद्ध प्रोडक्शन)

  • कमीत कमी विशेषाधिकार असलेल्या साधन परवानग्या

वर्तणुकीशी संबंधित अडचणी

  • एजंटला अंतर्गत पुराव्याचे तुकडे उद्धृत करण्यास भाग पाडा (बाह्य दुवे नाही, फक्त अंतर्गत संदर्भ)

  • आत्मविश्वास कमी असताना अनिश्चितता ध्वजांची आवश्यकता असते

  • जर इनपुट अस्पष्ट असतील तर "स्पष्टीकरण देणारा प्रश्न विचारा" आवश्यक आहे

एक विश्वासार्ह एजंट हा सर्वात आत्मविश्वासू नसतो. तो असा असतो जो अंदाज लावत असताना जाणतो... आणि तोच असे म्हणतो.


११) चाचणी आणि मूल्यांकन (प्रत्येकजण टाळतो तो भाग) 🧪📏

जे तुम्ही मोजू शकत नाही ते तुम्ही सुधारू शकत नाही. हो, ती ओळ चीझी आहे, पण ती त्रासदायकपणे खरी आहे.

परिस्थितीचा संच तयार करा

३०-१०० चाचणी केसेस तयार करा:

गुणांचे निकाल

यासारखे मेट्रिक्स वापरा:

  • कार्य यशस्वी होण्याचा दर

  • पूर्ण होण्याची वेळ

  • साधन त्रुटी पुनर्प्राप्ती दर

  • भ्रमाचे प्रमाण (पुराव्याशिवाय दावे)

  • मानवी मान्यता दर (जर पर्यवेक्षित मोडमध्ये असेल तर)

प्रॉम्प्ट आणि साधनांसाठी रिग्रेशन चाचण्या

तुम्ही कधीही बदलता:

  • टूल स्कीमा

  • सिस्टम सूचना

  • पुनर्प्राप्ती तर्कशास्त्र

  • मेमरी फॉरमॅट
    पुन्हा सूट चालवा.

एजंट हे संवेदनशील प्राणी असतात. घरातील रोपांसारखे, पण जास्त महाग.


१२) तुमचे बजेट न वितळवणारे तैनाती नमुने 💸🔥

एकाच सेवेने सुरुवात करा

खर्च नियंत्रणे लवकर जोडा

  • कॅशिंग पुनर्प्राप्ती परिणाम

  • सारांशांसह संभाषण स्थिती संकुचित करणे

  • रूटिंग आणि एक्सट्रॅक्शनसाठी लहान मॉडेल्स वापरणे

  • "खोल विचार करण्याची पद्धत" सर्वात कठीण पायऱ्यांपर्यंत मर्यादित करणे

सामान्य वास्तुकला निवड

  • स्टेटलेस कंट्रोलर + एक्सटर्नल स्टेट स्टोअर (DB/redis)

  • शक्य असेल तिथे टूल कॉल्स अयोग्य असतात स्ट्राइप “अयोग्य विनंत्या”

  • लांब कामांसाठी रांगेत उभे राहणे (म्हणजे तुम्ही वेब विनंती कायमची उघडी ठेवू नये)

तसेच: "किल स्विच" तयार करा. जोपर्यंत तुम्हाला त्याची खरोखर गरज नाही तोपर्यंत तुम्हाला त्याची गरज भासणार नाही 😬


१३) समारोपाच्या नोंदी - एआय एजंट कसा तयार करायचा यावरील संक्षिप्त आवृत्ती 🎁🤖

जर तुम्हाला दुसरे काही आठवत नसेल तर हे लक्षात ठेवा:

एजंट म्हणजे जादू नाही. ती अशी प्रणाली आहे जी अनेकदा मौल्यवान ठरण्यासाठी चांगले निर्णय घेते... आणि नुकसान होण्यापूर्वीच पराभव मान्य करते. शांतपणे दिलासा देणारी, एका अर्थाने 😌

आणि हो, जर तुम्ही ते योग्यरित्या तयार केले तर ते एका लहान डिजिटल इंटर्नला कामावर ठेवण्यासारखे वाटते जो कधीही झोपत नाही, कधीकधी घाबरतो आणि कागदपत्रे आवडतात. तर, मुळात एक इंटर्न.


वारंवार विचारले जाणारे प्रश्न

सोप्या भाषेत सांगायचे तर एआय एजंट म्हणजे काय?

एआय एजंट हा मुळात एक लूप असतो जो पुनरावृत्ती करतो: इनपुट घ्या, पुढचे पाऊल ठरवा, टूल वापरा, निकाल वाचा आणि ते पूर्ण होईपर्यंत पुनरावृत्ती करा. "एजेंटिक" भाग केवळ चॅटिंगमधून नाही तर कृती आणि निरीक्षणातून येतो. बरेच एजंट टूल अॅक्सेससह फक्त स्मार्ट ऑटोमेशन असतात, तर काही ज्युनियर ऑपरेटरसारखे वागतात जे त्रुटींमधून बरे होऊ शकतात.

फक्त प्रॉम्प्ट वापरण्याऐवजी मी एआय एजंट कधी तयार करावा?

जेव्हा काम बहु-चरणीय असेल, मध्यवर्ती निकालांवर आधारित बदल असेल आणि विश्वासार्ह साधन वापराची आवश्यकता असेल (API, डेटाबेस, तिकीट, कोड अंमलबजावणी) तेव्हा एजंट तयार करा. जेव्हा तुम्हाला रेलिंग आणि "पूर्ण" तपासण्याचा मार्ग असलेले पुनरावृत्ती करण्यायोग्य निकाल हवे असतील तेव्हा एजंट देखील उपयुक्त ठरतात. जर एक साधा प्रॉम्प्ट-रिस्पॉन्स काम करत असेल, तर एजंट सहसा अनावश्यक ओव्हरहेड आणि अतिरिक्त अपयश मोड असतो.

मी असा एआय एजंट कसा तयार करू जो लूपमध्ये अडकत नाही?

हार्ड स्टॉप अटी वापरा: कमाल पावले, कमाल टूल कॉल आणि स्पष्ट पूर्णता तपासणी. स्ट्रक्चर्ड टूल स्कीमा, टाइमआउट आणि रीट्रीज जोडा जे कायमचे पुन्हा प्रयत्न करणार नाहीत. निर्णय आणि टूल आउटपुट लॉग करा जेणेकरून तुम्हाला ते कुठे रुळावरून घसरते ते दिसेल. एक सामान्य सेफ्टी व्हॉल्व्ह म्हणजे एस्केलेशन: जर एजंट अनिश्चित असेल किंवा चुका पुन्हा करत असेल, तर त्याने सुधारणा करण्याऐवजी मदत मागितली पाहिजे.

एआय एजंट कसा तयार करायचा यासाठी किमान आर्किटेक्चर किती आहे?

कमीत कमी तुम्हाला एक कंट्रोलर लूप हवा आहे जो मॉडेलला ध्येय आणि संदर्भ पुरवतो, पुढील कृती विचारतो, विनंती केल्यास टूल कार्यान्वित करतो, निरीक्षण जोडतो आणि पुनरावृत्ती करतो. तुम्हाला कठोर इनपुट/आउटपुट आकार आणि "पूर्ण" तपासणी असलेली साधने देखील आवश्यक आहेत. जर तुम्ही स्थिती स्वच्छ ठेवली आणि चरण मर्यादा लागू केल्या तर रोल-युअर-ऑन लूप देखील चांगले काम करू शकते.

उत्पादनात विश्वासार्ह राहण्यासाठी मी टूल कॉलिंग कसे डिझाइन करावे?

टूल्स अरुंद, टाइप केलेले, परवानगी असलेले आणि प्रमाणित ठेवा—जेनेरिक “do_anything” टूल टाळा. एजंट इनपुट हाताने हलवू शकणार नाही म्हणून कठोर स्कीमा (जसे की स्ट्रक्चर्ड आउटपुट/फंक्शन कॉलिंग) पसंत करा. टूल लेयरवर अलॉयलिस्ट, रेट लिमिट आणि वापरकर्ता/ऑर्गनायझेशन परवानगी तपासणी जोडा. आयडेम्पोटेन्सी पॅटर्न वापरून, शक्य असेल तेव्हा पुन्हा चालवण्यासाठी सुरक्षित साधने डिझाइन करा.

एजंट खराब न करता मेमरी जोडण्याचा सर्वोत्तम मार्ग कोणता आहे?

मेमरीचे दोन भाग करा: अल्पकालीन रन स्टेट (अलीकडील पावले, चालू योजना, मर्यादा) आणि दीर्घकालीन पुनर्प्राप्ती (प्राधान्ये, स्थिर नियम, संबंधित दस्तऐवज). पूर्ण ट्रान्सक्रिप्ट्सऐवजी चालू सारांशांसह अल्पकालीन कॉम्पॅक्ट ठेवा. दीर्घकालीन मेमरीसाठी, पुनर्प्राप्ती (एम्बेडिंग + व्हेक्टर स्टोअर/आरएजी पॅटर्न) सहसा सर्वकाही संदर्भामध्ये "स्टफिंग" करण्यापेक्षा आणि मॉडेलला गोंधळात टाकण्यापेक्षा जास्त असते.

मी कोणता नियोजन नमुना वापरावा: चेकलिस्ट, रिएक्ट, की सुपरवायझर-वर्कर?

जेव्हा कामे अंदाजे असतात आणि तुम्हाला चाचणीसाठी सोपी गोष्ट हवी असते तेव्हा चेकलिस्ट प्लॅनर उत्तम असतो. जेव्हा टूलच्या निकालांमुळे तुम्ही पुढे काय करता ते बदलते तेव्हा रीअॅक्ट-शैलीतील लूप चमकतात. जेव्हा कार्ये समांतर केली जाऊ शकतात किंवा वेगवेगळ्या भूमिकांपासून (संशोधक, कोडर, क्यूए) फायदा घेता येतो तेव्हा पर्यवेक्षक-कामगार नमुने (जसे की ऑटोजेन-शैलीतील भूमिका वेगळे करणे) मदत करतात. हट्टी वाईट योजना टाळण्यासाठी प्लॅन-अन्-एक्झिक्युट आणि रिप्लॅनिंग हे एक व्यावहारिक मध्यम मार्ग आहे.

जर एजंट प्रत्यक्ष कारवाई करू शकत असेल तर मी त्याला कसे सुरक्षित बनवू?

कमीत कमी विशेषाधिकार असलेल्या परवानग्या वापरा आणि मंजुरी किंवा "ड्राय-रन" मोड्समागील धोकादायक साधने मर्यादित करा. बजेट आणि कॅप्स जोडा: कमाल पावले, कमाल खर्च आणि प्रति-मिनिट टूल कॉल मर्यादा. लॉगिंग करण्यापूर्वी संवेदनशील डेटा संपादित करा आणि उत्पादन वातावरणापासून डेव्हलपमेंट वेगळे करा. जेव्हा इनपुट अस्पष्ट असतात तेव्हा आत्मविश्वासाने पुराव्याची जागा घेण्याऐवजी अनिश्चितता ध्वज किंवा स्पष्टीकरणात्मक प्रश्न आवश्यक आहेत.

एआय एजंटची चाचणी आणि मूल्यांकन कसे करावे जेणेकरून तो कालांतराने सुधारेल?

हॅपी पाथ्स, एज केसेस, टूल फेल्युअर्स, अस्पष्ट रिक्वेस्ट्स आणि प्रॉम्प्ट-इंजेक्शन प्रयत्न (OWASP-शैली) असलेले एक परिदृश्य संच तयार करा. कार्य यश, पूर्ण होण्यास वेळ, टूल त्रुटींमधून पुनर्प्राप्ती आणि पुराव्याशिवाय दावे यासारखे निकाल मिळवा. जेव्हा तुम्ही टूल स्कीमा, प्रॉम्प्ट, पुनर्प्राप्ती किंवा मेमरी फॉरमॅटिंग बदलता तेव्हा संच पुन्हा चालवा. जर तुम्ही ते तपासू शकत नसाल, तर तुम्ही ते विश्वसनीयरित्या पाठवू शकत नाही.

विलंब आणि खर्च वाढवल्याशिवाय मी एजंट कसा तैनात करू?

एक सामान्य पॅटर्न म्हणजे स्टेटलेस कंट्रोलर ज्यामध्ये बाह्य स्टेट स्टोअर (DB/Redis), त्यामागे टूल सर्व्हिसेस आणि मजबूत लॉगिंग/मॉनिटरिंग (बहुतेकदा OpenTelemetry) असते. पुनर्प्राप्ती कॅशिंग, कॉम्पॅक्ट स्टेट सारांश, राउटिंग/एक्सट्रॅक्शनसाठी लहान मॉडेल्स आणि "खोल विचारसरणी" सर्वात कठीण चरणांपर्यंत मर्यादित करून खर्च नियंत्रित करा. लांब कामांसाठी रांगा वापरा जेणेकरून तुम्ही वेब रिक्वेस्ट्स उघड्या ठेवू नयेत. नेहमी किल स्विच समाविष्ट करा.

संदर्भ

  1. राष्ट्रीय मानके आणि तंत्रज्ञान संस्था (NIST) - NIST AI RMF 1.0 (विश्वसनीयता आणि पारदर्शकता) - nvlpubs.nist.gov

  2. ओपनएआय - स्ट्रक्चर्ड आउटपुट - platform.openai.com

  3. ओपनएआय - फंक्शन कॉलिंग मार्गदर्शक - platform.openai.com

  4. ओपनएआय - दर मर्यादा मार्गदर्शक - platform.openai.com

  5. OpenAI - API चालवते - platform.openai.com

  6. ओपनएआय - असिस्टंट्स फंक्शन कॉलिंग - platform.openai.com

  7. लँगचेन - एजंट्स डॉक्स (जावास्क्रिप्ट) - docs.langchain.com

  8. लँगचेन - टूल्स डॉक्स (पायथॉन) - docs.langchain.com

  9. लँगचेन - मेमरी ओव्हरव्यू - docs.langchain.com

  10. arXiv - रिएक्ट पेपर (कारण + कायदा) - arxiv.org

  11. arXiv - RAG पेपर - arxiv.org

  12. अमेझॉन वेब सर्व्हिसेस (AWS) बिल्डर्स लायब्ररी - टाइमआउट्स, रीट्राय आणि जिटरसह बॅकऑफ - aws.amazon.com

  13. ओपनटेलिमेट्री - निरीक्षणक्षमता प्राइमर - opentelemetry.io

  14. स्ट्राइप - अविचारी विनंत्या - docs.stripe.com

  15. गुगल क्लाउड - पुन्हा प्रयत्न करण्याची रणनीती (बॅकऑफ + जिटर) - docs.cloud.google.com

  16. OWASP - मोठ्या भाषेतील मॉडेल अनुप्रयोगांसाठी टॉप १० - owasp.org

  17. OWASP - LLM01 प्रॉम्प्ट इंजेक्शन - genai.owasp.org

  18. लामाइंडेक्स - आरएजीचा परिचय - developers.llamaindex.ai

  19. मायक्रोसॉफ्ट - सिमेंटिक कर्नल - learn.microsoft.com

  20. मायक्रोसॉफ्ट ऑटोजेन - मल्टी-एजंट फ्रेमवर्क (डॉक्युमेंटेशन) - microsoft.github.io

  21. क्रूएआय - एजंट्स संकल्पना - docs.crewai.com

  22. गवताची गंजी (डीपसेट) - रिट्रीव्हर्स दस्तऐवजीकरण - docs.haystack.deepset.ai

अधिकृत एआय असिस्टंट स्टोअरमध्ये नवीनतम एआय शोधा

आमच्याबद्दल

ब्लॉगवर परत