थोडक्यात उत्तर: प्रत्यक्षात काम करणारा एआय एजंट तयार करण्यासाठी, त्याला नियंत्रित लूप म्हणून हाताळा: इनपुट घ्या, पुढील कृती ठरवा, एका अरुंद व्याप्ती असलेल्या टूलला कॉल करा, निकालाचे निरीक्षण करा आणि स्पष्ट "पूर्ण" तपासणी होईपर्यंत पुनरावृत्ती करा. जेव्हा कार्य बहु-चरण आणि टूल-चालित असते तेव्हा ते त्याचे रक्षण करते; जर एकाच प्रॉम्प्टने ते सोडवले तर एजंट वगळा. कठोर टूल स्कीमा, स्टेप लिमिट्स, लॉगिंग आणि व्हॅलिडेटर/क्रिटिक जोडा जेणेकरून जेव्हा टूल्स अयशस्वी होतात किंवा इनपुट अस्पष्ट असतात तेव्हा एजंट लूपिंगऐवजी वाढतो.
महत्वाचे मुद्दे:
कंट्रोलर लूप : स्पष्ट स्टॉप कंडिशन आणि कमाल पायऱ्यांसह इनपुट→अॅक्ट→रिपीटेशनचे निरीक्षण करा.
टूल डिझाइन : "काहीही करा" गोंधळ टाळण्यासाठी टूल्स अरुंद, टाइप केलेले, परवानगी असलेले आणि प्रमाणित ठेवा.
मेमरी हायजिन : कॉम्पॅक्ट शॉर्ट-टर्म स्टेट आणि दीर्घकालीन रिट्रीव्हल वापरा; पूर्ण ट्रान्सक्रिप्ट्स डंप करणे टाळा.
गैरवापर प्रतिकार : धोकादायक कृतींसाठी अनुमती यादी, दर मर्यादा, अयोग्यता आणि "ड्राय-रन" जोडा.
चाचणीक्षमता : परिस्थितीचा संच (अपयश, अस्पष्टता, इंजेक्शन) ठेवा आणि प्रत्येक बदल पुन्हा चालवा.

🔗 एआय कामगिरी कशी मोजायची
वेग, अचूकता आणि विश्वासार्हता यांचे बेंचमार्क करण्यासाठी व्यावहारिक मेट्रिक्स शिका.
🔗 एआयशी कसे बोलावे
चांगली उत्तरे मिळविण्यासाठी सूचना, संदर्भ आणि फॉलो-अप वापरा.
🔗 एआय मॉडेल्सचे मूल्यांकन कसे करावे
चाचण्या, रूब्रिक्स आणि वास्तविक-जगातील कार्य परिणाम वापरून मॉडेल्सची तुलना करा.
🔗 एआय मॉडेल्स कसे ऑप्टिमाइझ करायचे
ट्यूनिंग, छाटणी आणि देखरेखीसह गुणवत्ता आणि खर्च सुधारा.
१) सामान्य माणसाच्या भाषेत, एआय एजंट म्हणजे काय 🧠
एआय एजंट हा एक लूप असतो. लँगचेन “एजंट्स” डॉक्स
बस्स. मध्यभागी मेंदू असलेला एक लूप.
इनपुट → विचार → कृती → निरीक्षण → पुनरावृत्ती करा . पुनर्अभिक्रिया पेपर (कारण + कृती)
कुठे:
-
इनपुट म्हणजे वापरकर्त्याची विनंती किंवा कार्यक्रम (नवीन ईमेल, सपोर्ट तिकीट, सेन्सर पिंग).
-
विचार करणे हे पुढील पायरीबद्दल तर्क करणारे एक भाषा मॉडेल आहे.
-
कायदा म्हणजे एक साधन कॉल करणे (अंतर्गत दस्तऐवज शोधा, कोड चालवा, तिकीट तयार करा, उत्तर मसुदा तयार करा). ओपनएआय फंक्शन कॉलिंग मार्गदर्शक
-
ऑब्झर्व्ह टूल आउटपुट वाचत आहे.
-
रिपीट हा असा भाग आहे जो "चॅटी" ऐवजी "एजेंटिक" वाटतो. लँगचेन "एजंट" डॉक्स
काही एजंट मुळात स्मार्ट मॅक्रो असतात. काही जण ज्युनियर ऑपरेटरसारखे काम करतात जे कामे व्यवस्थित करू शकतात आणि चुकांमधून सावरू शकतात. दोन्हीही महत्त्वाचे आहेत.
तसेच, तुम्हाला पूर्ण स्वायत्ततेची आवश्यकता नाही. खरं तर... तुम्हाला कदाचित ते नको असेल 🙃
२) तुम्ही एजंट कधी तयार करावा (आणि कधी करू नये) 🚦
एजंट तयार करा जेव्हा:
-
हे काम अनेक टप्प्यांचे आणि मध्यभागी काय होते यावर अवलंबून बदलते.
-
या कामासाठी टूल्सचा वापर (डेटाबेस, सीआरएम, कोड एक्झिक्युशन, फाइल जनरेशन, ब्राउझर, अंतर्गत एपीआय). लँगचेन “टूल्स” डॉक्स
-
तुम्हाला रेलिंगसह पुनरावृत्ती करता येणारे निकाल
-
तुम्ही "पूर्ण" ची व्याख्या संगणक तपासू शकेल अशा पद्धतीने करू शकता, अगदी सैल पद्धतीने देखील.
एजंट तयार करू नका जेव्हा:
-
एक साधा प्रॉम्प्ट + रिस्पॉन्स याने समस्या सोडवता येते (अतिरिक्त काम करू नका, नंतर तुम्हाला स्वतःचा द्वेष होईल).
-
तुम्हाला परिपूर्ण निश्चयवादाची आवश्यकता आहे (एजंट सुसंगत असू शकतात, परंतु रोबोटिक नाहीत).
-
तुमच्याकडे कनेक्ट करण्यासाठी कोणतेही टूल्स किंवा डेटा नाही - मग ते बहुतेक फक्त व्हायब्स आहे.
चला स्पष्टपणे सांगूया: "एआय एजंट प्रोजेक्ट्स" पैकी अर्धे भाग काही ब्रँचिंग नियमांसह वर्कफ्लो असू शकतात. पण अरे, कधीकधी व्हाइब देखील महत्त्वाचा असतो 🤷♂️
३) एआय एजंटची चांगली आवृत्ती कशामुळे बनते ✅
तुम्ही मागितलेला "चांगला व्हर्जन कशामुळे होतो" हा विभाग येथे आहे, मी थोडे स्पष्टपणे सांगेन:
एआय एजंटची चांगली आवृत्ती नसते जी सर्वात कठीण विचार करते. ती अशी असते जी:
-
त्याला काय करण्याची परवानगी आहे हे माहित आहे (व्याप्तीच्या सीमा)
-
साधनांचा विश्वसनीय वापर करते (संरचित कॉल, पुन्हा प्रयत्न, टाइमआउट) ओपनएआय फंक्शन कॉलिंग मार्गदर्शक AWS “टाइमआउट, पुन्हा प्रयत्न आणि जिटरसह बॅकऑफ”
-
स्थिती स्वच्छ ठेवते (स्मृती जी कुजत नाही) लँगचेन “स्मृती विहंगावलोकन”
-
त्याच्या कृती स्पष्ट करते (ऑडिट ट्रेल्स, गुप्त तर्क डंप नाही) NIST AI RMF 1.0 (विश्वसनीयता आणि पारदर्शकता)
-
योग्यरित्या थांबते (पूर्णता तपासणी, कमाल पावले, वाढ) लँगचेन “एजंट्स” डॉक्स
-
सुरक्षितपणे अपयशी ठरते (मदत मागते, अधिकाराचा भ्रम निर्माण करत नाही) NIST AI RMF 1.0
-
चाचणी करण्यायोग्य आहे (तुम्ही ते कॅन केलेल्या परिस्थितींवर चालवू शकता आणि निकाल मिळवू शकता)
जर तुमच्या एजंटची चाचणी घेतली जाऊ शकत नसेल, तर ती मुळात एक अतिशय आत्मविश्वासू स्लॉट मशीन आहे. पार्ट्यांमध्ये मजा, निर्मितीमध्ये भयानक 😬
४) एजंटचे मुख्य घटक ("शरीरशास्त्र" 🧩)
बहुतेक सॉलिड एजंट्समध्ये हे तुकडे असतात:
अ) कंट्रोलर लूप 🔁
हा वाद्यवृंद आहे:
-
ध्येय घ्या
-
पुढील कृतीसाठी मॉडेलला विचारा
-
रन टूल
-
निरीक्षण जोडा
-
पूर्ण होईपर्यंत पुन्हा करा लँगचेन “एजंट्स” डॉक्स
ब) साधने (म्हणजे क्षमता) 🧰
साधने ही एजंटला प्रभावी बनवतात: लँगचेन “टूल्स” डॉक्स
-
डेटाबेस क्वेरी
-
ईमेल पाठवणे
-
फायली ओढणे
-
रनिंग कोड
-
अंतर्गत API कॉल करणे
-
स्प्रेडशीट किंवा सीआरएमवर लिहिणे
क) स्मृती 🗃️
दोन प्रकारचे महत्त्व:
-
अल्पकालीन स्मृती : सध्याच्या धावपळीचा संदर्भ, अलीकडील पावले, सध्याची योजना
-
दीर्घकालीन स्मृती : वापरकर्त्याची प्राधान्ये, प्रकल्प संदर्भ, मिळवलेले ज्ञान (बहुतेकदा एम्बेडिंगद्वारे + वेक्टर स्टोअरद्वारे) RAG पेपर
ड) नियोजन आणि निर्णय धोरण 🧭
जरी तुम्ही त्याला "नियोजन" म्हणत नसलात तरी, तुम्हाला एक पद्धत आवश्यक आहे:
-
चेकलिस्ट
-
रिएक्ट-शैलीतील "विचार करा मग साधन" रिएक्ट पेपर
-
कार्य आलेख
-
पर्यवेक्षक-कामगार नमुने
-
सुपरवायझर-वर्कर पॅटर्न मायक्रोसॉफ्ट ऑटोजेन (मल्टी-एजंट फ्रेमवर्क)
ई) रेलिंग आणि मूल्यांकन 🧯
-
परवानग्या
-
सुरक्षित साधन योजना ओपनएआय स्ट्रक्चर्ड आउटपुट
-
आउटपुट प्रमाणीकरण
-
चरण मर्यादा
-
लॉगिंग
-
NIST AI RMF 1.0 ची चाचणी करते
हो, ते प्रॉम्प्टिंगपेक्षा जास्त इंजिनिअरिंग आहे. जे... मुद्दा थोडासा महत्त्वाचा आहे.
५) तुलना सारणी: एजंट तयार करण्याचे लोकप्रिय मार्ग 🧾
खाली एक वास्तववादी "तुलना सारणी" आहे - काही वैशिष्ट्यांसह, कारण खरे संघ विचित्र असतात 😄
| साधन / फ्रेमवर्क | प्रेक्षक | किंमत | ते का काम करते | नोट्स (लहान गोंधळ) | |
|---|---|---|---|---|---|
| लँगचेन | लेगो-शैलीतील घटकांना आवडणारे बांधकाम व्यावसायिक | फ्री-इश + इन्फ्रा | साधने, स्मृती, साखळ्यांसाठी मोठी परिसंस्था | जर तुम्ही गोष्टी स्पष्टपणे सांगितल्या नाहीत तर स्पॅगेटीसारखे जलद होऊ शकते | |
| लामाइंडेक्स | आरएजी-हेवी संघ | फ्री-इश + इन्फ्रा | मजबूत पुनर्प्राप्ती नमुने, अनुक्रमणिका, कनेक्टर | जेव्हा तुमचा एजंट मुळात "शोध + कृती" करतो तेव्हा उत्तम... जे सामान्य आहे | |
| ओपनएआय असिस्टंट्स शैलीचा दृष्टिकोन | जलद सेटअप हवे असलेले संघ | वापर-आधारित | अंगभूत टूल कॉलिंग पॅटर्न आणि रन स्टेट | काही कोपऱ्यांमध्ये कमी लवचिक, परंतु अनेक अॅप्ससाठी स्वच्छ | ओपनएआय एपीआय ओपनएआय असिस्टंट्स फंक्शन कॉलिंग |
| सिमेंटिक कर्नल | संरचित ऑर्केस्ट्रेशन हवे असलेले विकासक | मुक्त मनाचा | कौशल्ये/कार्यांसाठी सुरेख अमूर्तता | "उद्योग नीटनेटका" वाटतो - कधीकधी ते कौतुकास्पद असते 😉 | |
| ऑटोजेन | मल्टी-एजंट प्रयोगकर्ते | मुक्त मनाचा | एजंट-टू-एजंट सहयोग नमुने | जास्त बोलू शकतो; कडक समाप्तीचे नियम सेट करा | |
| क्रूएआय | "एजंटांच्या टीम" चे चाहते | मुक्त मनाचा | भूमिका + कामे + हँडऑफ व्यक्त करणे सोपे आहे | जेव्हा कामे मऊ नसून, चपखल असतात तेव्हा उत्तम काम करते | |
| गवताची गंजी | शोध + पाइपलाइन लोक | मुक्त मनाचा | घन पाइपलाइन, पुनर्प्राप्ती, घटक | "एजंट थिएटर" कमी, "प्रॅक्टिकल फॅक्टरी" जास्त | |
| स्वतःचे रोल करा (कस्टम लूप) | नियंत्रण करणारे (प्रेमळ) | तुमचा वेळ | किमान जादू, जास्तीत जास्त स्पष्टता | सहसा सर्वोत्तम दीर्घकालीन... जोपर्यंत तुम्ही सर्वकाही पुन्हा शोधत नाही तोपर्यंत 😅 |
एकही विजेता नाही. तुमच्या एजंटचे मुख्य काम पुनर्प्राप्ती , साधन अंमलबजावणी , बहु-एजंट समन्वय किंवा वर्कफ्लो ऑटोमेशन .
६) एआय एजंट कसा तयार करायचा ते चरण-दर-चरण (प्रत्यक्ष कृती) 🍳🤖
हा भाग बहुतेक लोक वगळतात, मग विचार करतात की एजंट पेंट्रीमध्ये रॅकूनसारखा का वागतो.
पायरी १: एका वाक्यात कामाची व्याख्या करा 🎯
उदाहरणे:
-
"धोरण आणि तिकिट संदर्भ वापरून ग्राहकाचे उत्तर तयार करा, नंतर मंजुरीसाठी विचारा."
-
"बग रिपोर्ट तपासा, तो पुन्हा तयार करा आणि दुरुस्त्या सुचवा."
-
"अपूर्ण बैठकीच्या नोट्सना कार्ये, मालक आणि अंतिम मुदतींमध्ये बदला."
जर तुम्ही ते सोप्या पद्धतीने परिभाषित करू शकत नसाल, तर तुमचा एजंटही करू शकत नाही. म्हणजे ते करू शकते, पण ते सुधारेल, आणि सुधारणेमुळे बजेट संपते.
पायरी २: स्वायत्तता पातळी निश्चित करा (कमी, मध्यम, मसालेदार) 🌶️
-
कमी स्वायत्तता : पावले सुचवते, मानवी क्लिक "मंजूर" करतात.
-
माध्यम : साधने चालवते, आउटपुट तयार करते, अनिश्चिततेवर वाढते
-
उच्च : एंड-टू-एंड कार्यान्वित करते, फक्त अपवादांवर मानवांना पिंग करते.
तुम्हाला हव्या त्यापेक्षा कमी सुरुवात करा. तुम्ही नंतर कधीही ते वाढवू शकता.
पायरी ३: तुमची मॉडेल स्ट्रॅटेजी निवडा 🧠
तुम्ही सामान्यतः निवडता:
-
प्रत्येक गोष्टीसाठी एक मजबूत मॉडेल (सोपे)
-
स्वस्त पायऱ्यांसाठी एक मजबूत मॉडेल + लहान मॉडेल (वर्गीकरण, रूटिंग)
-
आवश्यक असल्यास विशेष मॉडेल्स (दृष्टी, कोड, भाषण)
हे देखील ठरवा:
-
कमाल टोकन
-
तापमान
-
तुम्ही अंतर्गतरित्या दीर्घ तर्कशुद्धतेला परवानगी देता का (तुम्ही हे करू शकता, परंतु अंतिम वापरकर्त्यांसमोर कच्च्या विचारांची साखळी उघड करू नका)
पायरी ४: कठोर स्कीमासह टूल्स परिभाषित करा 🔩
साधने अशी असावीत:
-
अरुंद
-
टाइप केलेले
-
परवानगी दिलेली
-
प्रमाणित ओपनएआय स्ट्रक्चर्ड आउटपुट
do_anything(input: string) नावाच्या टूलऐवजी , हे बनवा:
-
search_kb(क्वेरी: स्ट्रिंग) -> निकाल[] -
तिकीट तयार करा (शीर्षक: स्ट्रिंग, मुख्य भाग: स्ट्रिंग, प्राधान्य: एनम) -> तिकीट_आयडी -
send_email(to: string, subject: string, body: string) -> statusOpenAI फंक्शन कॉलिंग मार्गदर्शक
जर तुम्ही एजंटला चेनसॉ दिला तर तो कुंपण काढून कुंपण कापेल तेव्हा आश्चर्यचकित होऊ नका.
पायरी ५: कंट्रोलर लूप तयार करा 🔁
किमान लूप:
-
ध्येय + प्रारंभिक संदर्भाने सुरुवात करा
-
मॉडेलला विचारा: "पुढील कृती?"
-
जर टूल कॉल केला तर - टूल एक्झिक्युट करा
-
निरीक्षण जोडा
-
थांब्याची स्थिती तपासा
-
पुनरावृत्ती करा (जास्तीत जास्त पायऱ्यांसह) लँगचेन “एजंट” डॉक्स
जोडा:
-
टाइमआउट्स
-
पुन्हा प्रयत्न करा (काळजीपूर्वक - पुन्हा प्रयत्न लूप होऊ शकतात) AWS “टाइमआउट्स, पुन्हा प्रयत्न आणि जिटरसह बॅकऑफ”
-
टूल एरर फॉरमॅटिंग (स्पष्ट, संरचित)
पायरी ६: मेमरी काळजीपूर्वक जोडा 🗃️
अल्पकालीन: प्रत्येक टप्प्यावर एक संक्षिप्त "स्थिती सारांश" अद्यतनित ठेवा. लँगचेन "मेमरी ओव्हरव्यू"
दीर्घकालीन: टिकाऊ तथ्ये साठवा (वापरकर्ता प्राधान्ये, संस्थेचे नियम, स्थिर दस्तऐवज).
अंगठ्याचा नियम:
-
जर ते वारंवार बदलत असेल तर - ते अल्पकालीन ठेवा
-
जर ते स्थिर असेल तर - दीर्घकाळ साठवा
-
जर ते संवेदनशील असेल तर - कमीत कमी साठवा (किंवा अजिबात नाही)
पायरी ७: व्हॅलिडेशन आणि "क्रिटिक" पास जोडा 🧪
एक स्वस्त, व्यावहारिक नमुना:
-
एजंट निकाल निर्माण करतो
-
व्हॅलिडेटर रचना आणि मर्यादा तपासतो
-
गहाळ पावले किंवा धोरण उल्लंघनांसाठी पर्यायी समीक्षक मॉडेल पुनरावलोकने NIST AI RMF 1.0
परिपूर्ण नाही, पण त्यात धक्कादायक प्रमाणात मूर्खपणा आढळतो.
पायरी ८: लॉग इन न केल्याबद्दल तुम्हाला पश्चात्ताप होईल अशा सर्व गोष्टी लॉग करा 📜
लॉग:
-
टूल कॉल + इनपुट + आउटपुट
-
घेतलेले निर्णय
-
चुका
-
अंतिम निकाल
-
टोकन आणि विलंब ओपनटेलिमेट्री ऑब्झर्व्हेबिलिटी प्रायमर
भविष्य - तुम्ही तुमचे आभार मानाल. वर्तमान - तुम्ही विसराल. हेच तर आयुष्य आहे 😵💫
७) असे साधन जे तुमच्या आत्म्याला तोडणार नाही 🧰😵
टूल कॉलिंग म्हणजे "एआय एजंट कसा तयार करायचा" हे खरे सॉफ्टवेअर अभियांत्रिकी बनते.
साधने विश्वासार्ह बनवा (विश्वासार्ह असणे चांगले)
विश्वासार्ह साधने अशी आहेत:
-
नियतकालिक
-
मर्यादित व्याप्ती
-
चाचणी करणे सोपे
-
स्ट्राइप “आयडेम्पॉटेंट रिक्वेस्ट्स” पुन्हा चालवणे सुरक्षित आहे
टूल लेयरवर फक्त प्रॉम्प्ट्सच नाही तर रेलिंग जोडा
सूचना विनम्र सूचना आहेत. टूल व्हॅलिडेशन हे एक लॉक केलेले दार आहे. ओपनएआय स्ट्रक्चर्ड आउटपुट
करा:
-
अनुमती यादी (कोणती साधने चालू शकतात)
-
इनपुट प्रमाणीकरण
-
दर मर्यादा ओपनएआय दर मर्यादा मार्गदर्शक
-
प्रति वापरकर्ता/संस्था परवानगी तपासणी
-
धोकादायक कृतींसाठी "ड्राय-रन मोड"
आंशिक अपयशासाठी डिझाइन
साधने बिघडली. नेटवर्क डळमळीत झाले. ऑथेशन कालबाह्य झाले. एजंटने हे करणे आवश्यक आहे:
-
चुकांचा अर्थ लावणे
-
योग्य असेल तेव्हा बॅकऑफसह पुन्हा प्रयत्न करा Google क्लाउड पुन्हा प्रयत्न करण्याची रणनीती (बॅकऑफ + जिटर)
-
पर्यायी साधने निवडा
-
अडकल्यावर वाढवा
एक शांतपणे प्रभावी युक्ती: संरचित त्रुटी परत करा जसे की:
-
प्रकार: auth_error -
प्रकार: सापडले नाही -
प्रकार: rate_limited
म्हणजे मॉडेल घाबरण्याऐवजी हुशारीने प्रतिसाद देऊ शकेल.
८) तुम्हाला त्रास देण्याऐवजी मदत करणारी आठवण 👻🗂️
स्मरणशक्ती शक्तिशाली असते, पण ती रद्दीचा डबा देखील बनू शकते.
अल्पकालीन स्मृती: ती संक्षिप्त ठेवा
वापरा:
-
शेवटचे N टप्पे
-
चालू सारांश (प्रत्येक लूप अपडेट केला जातो)
-
सध्याची योजना
-
सध्याच्या अडचणी (बजेट, वेळ, धोरणे)
जर तुम्ही सर्वकाही संदर्भात टाकले तर तुम्हाला मिळेल:
-
जास्त खर्च
-
हळू विलंब
-
अधिक गोंधळ (हो, तरीही)
दीर्घकालीन स्मृती: "स्टफिंग" वरून पुनर्प्राप्ती
बहुतेक "दीर्घकालीन स्मृती" यासारखी असते:
-
एम्बेडिंग्ज
-
वेक्टर स्टोअर
-
पुनर्प्राप्ती संवर्धित पिढी (RAG) RAG पेपर
एजंट लक्षात ठेवत नाही. तो रनटाइमवर सर्वात संबंधित स्निपेट पुनर्प्राप्त करतो. LlamaIndex “RAG ची ओळख”
व्यावहारिक स्मृतीचे नियम
-
"प्राधान्ये" ही स्पष्ट तथ्ये म्हणून साठवा: "वापरकर्त्याला बुलेट सारांश आवडतात आणि इमोजी आवडत नाहीत" (हाहा, इथे नाहीये 😄)
-
"निर्णय" टाइमस्टॅम्प किंवा आवृत्त्यांसह साठवा (अन्यथा विरोधाभास जमा होतात)
-
खरोखर गरज असल्याशिवाय कधीही गुपिते साठवू नका
आणि इथे माझा अपूर्ण उपमा आहे: स्मृती ही रेफ्रिजरेटरसारखी आहे. जर तुम्ही ती कधीही स्वच्छ केली नाही, तर शेवटी तुमच्या सँडविचला कांद्यासारखे आणि पश्चात्तापासारखे चव येईल.
९) नियोजन नमुने (सोप्या ते फॅन्सीपर्यंत) 🧭✨
नियोजन म्हणजे फक्त नियंत्रित विघटन. ते गूढ बनवू नका.
नमुना अ: चेकलिस्ट प्लॅनर ✅
-
मॉडेल चरणांची यादी दर्शविते
-
चरण-दर-चरण कार्यान्वित करते
-
चेकलिस्टची स्थिती अपडेट करते
ऑनबोर्डिंगसाठी उत्तम. सोपे, चाचणी करण्यायोग्य.
पॅटर्न बी: रिएक्ट लूप (कारण + कृती) 🧠→🧰
-
मॉडेल पुढील टूल कॉल ठरवते
-
आउटपुटचे निरीक्षण करते
-
ReAct पेपरची पुनरावृत्ती करतो
ही क्लासिक एजंटची भावना आहे.
नमुना क: पर्यवेक्षक-कार्यकर्ता 👥
-
पर्यवेक्षक ध्येयाचे कामांमध्ये विभाजन करतो
-
कामगार विशेष कामे करतात
-
सुपरवायझरने निकाल विलीन केले मायक्रोसॉफ्ट ऑटोजेन (मल्टी-एजंट फ्रेमवर्क)
जेव्हा कार्ये समांतर करता येतात किंवा जेव्हा तुम्हाला वेगवेगळ्या "भूमिका" हव्या असतात जसे की:
-
संशोधक
-
कोडर
-
संपादक
-
QA तपासक
पॅटर्न डी: पुनर्नियोजनासह योजना करा-नंतर-अंमलात आणा 🔄
-
योजना तयार करा
-
अंमलात आणणे
-
जर साधनाच्या परिणामांमुळे वास्तव बदलले तर पुन्हा नियोजन करा
हे एजंटला वाईट योजनेचे अनुसरण करण्यापासून रोखते. मानव देखील हे करतात, जोपर्यंत ते थकलेले नसतात, अशा परिस्थितीत ते देखील वाईट योजनांचे अनुसरण करतात.
१०) सुरक्षितता, विश्वासार्हता आणि नोकरीवरून काढून टाकले जाणार नाही 🔐😅
जर तुमचा एजंट कारवाई करू शकत असेल, तर तुम्हाला सुरक्षा डिझाइनची आवश्यकता आहे. "असणे छान" नाही. गरज आहे. NIST AI RMF 1.0
कठोर मर्यादा
-
प्रति धाव कमाल पावले
-
प्रति मिनिट जास्तीत जास्त टूल कॉल
-
प्रति सत्र कमाल खर्च (टोकन बजेट)
-
मंजुरीमागे प्रतिबंधित साधने
डेटा हाताळणी
-
लॉगिंग करण्यापूर्वी संवेदनशील इनपुट संपादित करा
-
वेगळे वातावरण (डेव्हलपमेंट विरुद्ध प्रोडक्शन)
-
कमीत कमी विशेषाधिकार असलेल्या साधन परवानग्या
वर्तणुकीशी संबंधित अडचणी
-
एजंटला अंतर्गत पुराव्याचे तुकडे उद्धृत करण्यास भाग पाडा (बाह्य दुवे नाही, फक्त अंतर्गत संदर्भ)
-
आत्मविश्वास कमी असताना अनिश्चितता ध्वजांची आवश्यकता असते
-
जर इनपुट अस्पष्ट असतील तर "स्पष्टीकरण देणारा प्रश्न विचारा" आवश्यक आहे
एक विश्वासार्ह एजंट हा सर्वात आत्मविश्वासू नसतो. तो असा असतो जो अंदाज लावत असताना जाणतो... आणि तोच असे म्हणतो.
११) चाचणी आणि मूल्यांकन (प्रत्येकजण टाळतो तो भाग) 🧪📏
जे तुम्ही मोजू शकत नाही ते तुम्ही सुधारू शकत नाही. हो, ती ओळ चीझी आहे, पण ती त्रासदायकपणे खरी आहे.
परिस्थितीचा संच तयार करा
३०-१०० चाचणी केसेस तयार करा:
-
आनंदी मार्ग
-
एज केसेस
-
"साधन अयशस्वी" प्रकरणे
-
अस्पष्ट विनंत्या
-
अॅडव्हर्सरियल प्रॉम्प्ट (प्रॉम्प्ट इंजेक्शन प्रयत्न) OWASP LLM अॅप्ससाठी टॉप १० OWASP LLM01 प्रॉम्प्ट इंजेक्शन
गुणांचे निकाल
यासारखे मेट्रिक्स वापरा:
-
कार्य यशस्वी होण्याचा दर
-
पूर्ण होण्याची वेळ
-
साधन त्रुटी पुनर्प्राप्ती दर
-
भ्रमाचे प्रमाण (पुराव्याशिवाय दावे)
-
मानवी मान्यता दर (जर पर्यवेक्षित मोडमध्ये असेल तर)
प्रॉम्प्ट आणि साधनांसाठी रिग्रेशन चाचण्या
तुम्ही कधीही बदलता:
-
टूल स्कीमा
-
सिस्टम सूचना
-
पुनर्प्राप्ती तर्कशास्त्र
-
मेमरी फॉरमॅट
पुन्हा सूट चालवा.
एजंट हे संवेदनशील प्राणी असतात. घरातील रोपांसारखे, पण जास्त महाग.
१२) तुमचे बजेट न वितळवणारे तैनाती नमुने 💸🔥
एकाच सेवेने सुरुवात करा
-
एजंट कंट्रोलर API
-
त्यामागील साधन सेवा
-
लॉगिंग + मॉनिटरिंग ओपनटेलिमेट्री ऑब्झर्व्हेबिलिटी प्रायमर
खर्च नियंत्रणे लवकर जोडा
-
कॅशिंग पुनर्प्राप्ती परिणाम
-
सारांशांसह संभाषण स्थिती संकुचित करणे
-
रूटिंग आणि एक्सट्रॅक्शनसाठी लहान मॉडेल्स वापरणे
-
"खोल विचार करण्याची पद्धत" सर्वात कठीण पायऱ्यांपर्यंत मर्यादित करणे
सामान्य वास्तुकला निवड
-
स्टेटलेस कंट्रोलर + एक्सटर्नल स्टेट स्टोअर (DB/redis)
-
शक्य असेल तिथे टूल कॉल्स अयोग्य असतात स्ट्राइप “अयोग्य विनंत्या”
-
लांब कामांसाठी रांगेत उभे राहणे (म्हणजे तुम्ही वेब विनंती कायमची उघडी ठेवू नये)
तसेच: "किल स्विच" तयार करा. जोपर्यंत तुम्हाला त्याची खरोखर गरज नाही तोपर्यंत तुम्हाला त्याची गरज भासणार नाही 😬
१३) समारोपाच्या नोंदी - एआय एजंट कसा तयार करायचा यावरील संक्षिप्त आवृत्ती 🎁🤖
जर तुम्हाला दुसरे काही आठवत नसेल तर हे लक्षात ठेवा:
-
एआय एजंट कसा तयार करायचा हे मुख्यतः मॉडेलभोवती सुरक्षित लूप तयार करण्याबद्दल असते. लँगचेन “एजंट्स” डॉक्स
-
एक स्पष्ट ध्येय, कमी स्वायत्तता आणि कडक साधनांसह सुरुवात करा. ओपनएआय स्ट्रक्चर्ड आउटपुट
-
अंतहीन संदर्भ भरण्याऐवजी पुनर्प्राप्तीद्वारे मेमरी जोडा. RAG पेपर
-
नियोजन सोपे असू शकते - चेकलिस्ट आणि पुनर्नियोजन खूप दूरवर जाते.
-
लॉगिंग आणि चाचण्या एजंट गोंधळाला अशा गोष्टीत बदलतात ज्या तुम्ही पाठवू शकता. ओपनटेलिमेट्री ऑब्झर्व्हेबिलिटी प्रायमर
-
रेलिंग फक्त प्रॉम्प्टमध्ये नाही तर कोडमध्ये असतात. एलएलएम अॅप्ससाठी ओडब्ल्यूएएसपी टॉप १०
एजंट म्हणजे जादू नाही. ती अशी प्रणाली आहे जी अनेकदा मौल्यवान ठरण्यासाठी चांगले निर्णय घेते... आणि नुकसान होण्यापूर्वीच पराभव मान्य करते. शांतपणे दिलासा देणारी, एका अर्थाने 😌
आणि हो, जर तुम्ही ते योग्यरित्या तयार केले तर ते एका लहान डिजिटल इंटर्नला कामावर ठेवण्यासारखे वाटते जो कधीही झोपत नाही, कधीकधी घाबरतो आणि कागदपत्रे आवडतात. तर, मुळात एक इंटर्न.
वारंवार विचारले जाणारे प्रश्न
सोप्या भाषेत सांगायचे तर एआय एजंट म्हणजे काय?
एआय एजंट हा मुळात एक लूप असतो जो पुनरावृत्ती करतो: इनपुट घ्या, पुढचे पाऊल ठरवा, टूल वापरा, निकाल वाचा आणि ते पूर्ण होईपर्यंत पुनरावृत्ती करा. "एजेंटिक" भाग केवळ चॅटिंगमधून नाही तर कृती आणि निरीक्षणातून येतो. बरेच एजंट टूल अॅक्सेससह फक्त स्मार्ट ऑटोमेशन असतात, तर काही ज्युनियर ऑपरेटरसारखे वागतात जे त्रुटींमधून बरे होऊ शकतात.
फक्त प्रॉम्प्ट वापरण्याऐवजी मी एआय एजंट कधी तयार करावा?
जेव्हा काम बहु-चरणीय असेल, मध्यवर्ती निकालांवर आधारित बदल असेल आणि विश्वासार्ह साधन वापराची आवश्यकता असेल (API, डेटाबेस, तिकीट, कोड अंमलबजावणी) तेव्हा एजंट तयार करा. जेव्हा तुम्हाला रेलिंग आणि "पूर्ण" तपासण्याचा मार्ग असलेले पुनरावृत्ती करण्यायोग्य निकाल हवे असतील तेव्हा एजंट देखील उपयुक्त ठरतात. जर एक साधा प्रॉम्प्ट-रिस्पॉन्स काम करत असेल, तर एजंट सहसा अनावश्यक ओव्हरहेड आणि अतिरिक्त अपयश मोड असतो.
मी असा एआय एजंट कसा तयार करू जो लूपमध्ये अडकत नाही?
हार्ड स्टॉप अटी वापरा: कमाल पावले, कमाल टूल कॉल आणि स्पष्ट पूर्णता तपासणी. स्ट्रक्चर्ड टूल स्कीमा, टाइमआउट आणि रीट्रीज जोडा जे कायमचे पुन्हा प्रयत्न करणार नाहीत. निर्णय आणि टूल आउटपुट लॉग करा जेणेकरून तुम्हाला ते कुठे रुळावरून घसरते ते दिसेल. एक सामान्य सेफ्टी व्हॉल्व्ह म्हणजे एस्केलेशन: जर एजंट अनिश्चित असेल किंवा चुका पुन्हा करत असेल, तर त्याने सुधारणा करण्याऐवजी मदत मागितली पाहिजे.
एआय एजंट कसा तयार करायचा यासाठी किमान आर्किटेक्चर किती आहे?
कमीत कमी तुम्हाला एक कंट्रोलर लूप हवा आहे जो मॉडेलला ध्येय आणि संदर्भ पुरवतो, पुढील कृती विचारतो, विनंती केल्यास टूल कार्यान्वित करतो, निरीक्षण जोडतो आणि पुनरावृत्ती करतो. तुम्हाला कठोर इनपुट/आउटपुट आकार आणि "पूर्ण" तपासणी असलेली साधने देखील आवश्यक आहेत. जर तुम्ही स्थिती स्वच्छ ठेवली आणि चरण मर्यादा लागू केल्या तर रोल-युअर-ऑन लूप देखील चांगले काम करू शकते.
उत्पादनात विश्वासार्ह राहण्यासाठी मी टूल कॉलिंग कसे डिझाइन करावे?
टूल्स अरुंद, टाइप केलेले, परवानगी असलेले आणि प्रमाणित ठेवा—जेनेरिक “do_anything” टूल टाळा. एजंट इनपुट हाताने हलवू शकणार नाही म्हणून कठोर स्कीमा (जसे की स्ट्रक्चर्ड आउटपुट/फंक्शन कॉलिंग) पसंत करा. टूल लेयरवर अलॉयलिस्ट, रेट लिमिट आणि वापरकर्ता/ऑर्गनायझेशन परवानगी तपासणी जोडा. आयडेम्पोटेन्सी पॅटर्न वापरून, शक्य असेल तेव्हा पुन्हा चालवण्यासाठी सुरक्षित साधने डिझाइन करा.
एजंट खराब न करता मेमरी जोडण्याचा सर्वोत्तम मार्ग कोणता आहे?
मेमरीचे दोन भाग करा: अल्पकालीन रन स्टेट (अलीकडील पावले, चालू योजना, मर्यादा) आणि दीर्घकालीन पुनर्प्राप्ती (प्राधान्ये, स्थिर नियम, संबंधित दस्तऐवज). पूर्ण ट्रान्सक्रिप्ट्सऐवजी चालू सारांशांसह अल्पकालीन कॉम्पॅक्ट ठेवा. दीर्घकालीन मेमरीसाठी, पुनर्प्राप्ती (एम्बेडिंग + व्हेक्टर स्टोअर/आरएजी पॅटर्न) सहसा सर्वकाही संदर्भामध्ये "स्टफिंग" करण्यापेक्षा आणि मॉडेलला गोंधळात टाकण्यापेक्षा जास्त असते.
मी कोणता नियोजन नमुना वापरावा: चेकलिस्ट, रिएक्ट, की सुपरवायझर-वर्कर?
जेव्हा कामे अंदाजे असतात आणि तुम्हाला चाचणीसाठी सोपी गोष्ट हवी असते तेव्हा चेकलिस्ट प्लॅनर उत्तम असतो. जेव्हा टूलच्या निकालांमुळे तुम्ही पुढे काय करता ते बदलते तेव्हा रीअॅक्ट-शैलीतील लूप चमकतात. जेव्हा कार्ये समांतर केली जाऊ शकतात किंवा वेगवेगळ्या भूमिकांपासून (संशोधक, कोडर, क्यूए) फायदा घेता येतो तेव्हा पर्यवेक्षक-कामगार नमुने (जसे की ऑटोजेन-शैलीतील भूमिका वेगळे करणे) मदत करतात. हट्टी वाईट योजना टाळण्यासाठी प्लॅन-अन्-एक्झिक्युट आणि रिप्लॅनिंग हे एक व्यावहारिक मध्यम मार्ग आहे.
जर एजंट प्रत्यक्ष कारवाई करू शकत असेल तर मी त्याला कसे सुरक्षित बनवू?
कमीत कमी विशेषाधिकार असलेल्या परवानग्या वापरा आणि मंजुरी किंवा "ड्राय-रन" मोड्समागील धोकादायक साधने मर्यादित करा. बजेट आणि कॅप्स जोडा: कमाल पावले, कमाल खर्च आणि प्रति-मिनिट टूल कॉल मर्यादा. लॉगिंग करण्यापूर्वी संवेदनशील डेटा संपादित करा आणि उत्पादन वातावरणापासून डेव्हलपमेंट वेगळे करा. जेव्हा इनपुट अस्पष्ट असतात तेव्हा आत्मविश्वासाने पुराव्याची जागा घेण्याऐवजी अनिश्चितता ध्वज किंवा स्पष्टीकरणात्मक प्रश्न आवश्यक आहेत.
एआय एजंटची चाचणी आणि मूल्यांकन कसे करावे जेणेकरून तो कालांतराने सुधारेल?
हॅपी पाथ्स, एज केसेस, टूल फेल्युअर्स, अस्पष्ट रिक्वेस्ट्स आणि प्रॉम्प्ट-इंजेक्शन प्रयत्न (OWASP-शैली) असलेले एक परिदृश्य संच तयार करा. कार्य यश, पूर्ण होण्यास वेळ, टूल त्रुटींमधून पुनर्प्राप्ती आणि पुराव्याशिवाय दावे यासारखे निकाल मिळवा. जेव्हा तुम्ही टूल स्कीमा, प्रॉम्प्ट, पुनर्प्राप्ती किंवा मेमरी फॉरमॅटिंग बदलता तेव्हा संच पुन्हा चालवा. जर तुम्ही ते तपासू शकत नसाल, तर तुम्ही ते विश्वसनीयरित्या पाठवू शकत नाही.
विलंब आणि खर्च वाढवल्याशिवाय मी एजंट कसा तैनात करू?
एक सामान्य पॅटर्न म्हणजे स्टेटलेस कंट्रोलर ज्यामध्ये बाह्य स्टेट स्टोअर (DB/Redis), त्यामागे टूल सर्व्हिसेस आणि मजबूत लॉगिंग/मॉनिटरिंग (बहुतेकदा OpenTelemetry) असते. पुनर्प्राप्ती कॅशिंग, कॉम्पॅक्ट स्टेट सारांश, राउटिंग/एक्सट्रॅक्शनसाठी लहान मॉडेल्स आणि "खोल विचारसरणी" सर्वात कठीण चरणांपर्यंत मर्यादित करून खर्च नियंत्रित करा. लांब कामांसाठी रांगा वापरा जेणेकरून तुम्ही वेब रिक्वेस्ट्स उघड्या ठेवू नयेत. नेहमी किल स्विच समाविष्ट करा.
संदर्भ
-
राष्ट्रीय मानके आणि तंत्रज्ञान संस्था (NIST) - NIST AI RMF 1.0 (विश्वसनीयता आणि पारदर्शकता) - nvlpubs.nist.gov
-
ओपनएआय - स्ट्रक्चर्ड आउटपुट - platform.openai.com
-
ओपनएआय - फंक्शन कॉलिंग मार्गदर्शक - platform.openai.com
-
ओपनएआय - दर मर्यादा मार्गदर्शक - platform.openai.com
-
OpenAI - API चालवते - platform.openai.com
-
ओपनएआय - असिस्टंट्स फंक्शन कॉलिंग - platform.openai.com
-
लँगचेन - एजंट्स डॉक्स (जावास्क्रिप्ट) - docs.langchain.com
-
लँगचेन - टूल्स डॉक्स (पायथॉन) - docs.langchain.com
-
लँगचेन - मेमरी ओव्हरव्यू - docs.langchain.com
-
arXiv - रिएक्ट पेपर (कारण + कायदा) - arxiv.org
-
arXiv - RAG पेपर - arxiv.org
-
अमेझॉन वेब सर्व्हिसेस (AWS) बिल्डर्स लायब्ररी - टाइमआउट्स, रीट्राय आणि जिटरसह बॅकऑफ - aws.amazon.com
-
ओपनटेलिमेट्री - निरीक्षणक्षमता प्राइमर - opentelemetry.io
-
स्ट्राइप - अविचारी विनंत्या - docs.stripe.com
-
गुगल क्लाउड - पुन्हा प्रयत्न करण्याची रणनीती (बॅकऑफ + जिटर) - docs.cloud.google.com
-
OWASP - मोठ्या भाषेतील मॉडेल अनुप्रयोगांसाठी टॉप १० - owasp.org
-
OWASP - LLM01 प्रॉम्प्ट इंजेक्शन - genai.owasp.org
-
लामाइंडेक्स - आरएजीचा परिचय - developers.llamaindex.ai
-
मायक्रोसॉफ्ट - सिमेंटिक कर्नल - learn.microsoft.com
-
मायक्रोसॉफ्ट ऑटोजेन - मल्टी-एजंट फ्रेमवर्क (डॉक्युमेंटेशन) - microsoft.github.io
-
क्रूएआय - एजंट्स संकल्पना - docs.crewai.com
-
गवताची गंजी (डीपसेट) - रिट्रीव्हर्स दस्तऐवजीकरण - docs.haystack.deepset.ai