एआय कसे काम करते?

एआय कसे काम करते?

कृत्रिम बुद्धिमत्ता ही एक जादूची युक्ती वाटू शकते जी प्रत्येकजण शांतपणे विचार करत असताना मान हलवतो... थांबा, हे प्रत्यक्षात काम करते? चांगली बातमी. आम्ही ते गोंधळात टाकल्याशिवाय उलगडू, व्यावहारिक राहू आणि काही अपूर्ण उपमा देऊ ज्यामुळे ते अजूनही क्लिक करू शकेल. जर तुम्हाला फक्त सारांश हवा असेल, तर खालील एका मिनिटाच्या उत्तरावर जा; पण प्रामाणिकपणे सांगायचे तर, तपशील तिथेच आहेत जिथे लाईट बल्ब पॉप होतो 💡.

या लेखानंतर तुम्हाला वाचायला आवडतील असे लेख:

🔗 GPT म्हणजे काय?
GPT या संक्षिप्त रूपाचे आणि त्याच्या अर्थाचे एक जलद स्पष्टीकरण.

🔗 एआयला त्याची माहिती कुठून मिळते?
एआय शिकण्यासाठी, प्रशिक्षण देण्यासाठी आणि प्रश्नांची उत्तरे देण्यासाठी वापरतात.

🔗 तुमच्या व्यवसायात एआय कसे समाविष्ट करावे
एआय प्रभावीपणे एकत्रित करण्यासाठी व्यावहारिक पावले, साधने आणि कार्यप्रवाह.

🔗 एआय कंपनी कशी सुरू करावी
कल्पनेपासून लाँचपर्यंत: प्रमाणीकरण, निधी, संघ आणि अंमलबजावणी.


एआय कसे काम करते? एका मिनिटाचे उत्तर ⏱️

एआय डेटामधून पॅटर्न शिकून भाकिते बनवते किंवा कंटेंट तयार करते - हस्तलिखित नियमांची आवश्यकता नाही. सिस्टम उदाहरणे घेते, लॉस फंक्शनद्वारे ते किती चुकीचे आहे हे मोजते आणि प्रत्येक वेळी थोडे कमी चुकीचे होण्यासाठी त्याच्या अंतर्गत नॉब्स - पॅरामीटर्स - ला धक्का देते. स्वच्छ धुवा, पुनरावृत्ती करा, सुधारणा करा. पुरेशा चक्रांसह, ते उपयुक्त ठरते. तुम्ही ईमेल वर्गीकृत करत असलात तरी, ट्यूमर शोधत असलात तरी, बोर्ड गेम खेळत असलात तरी किंवा हायकू लिहित असलात तरी तीच कथा. "मशीन लर्निंग" मध्ये साध्या भाषेतील ग्राउंडिंगसाठी, आयबीएमचा आढावा ठोस आहे [1].

बहुतेक आधुनिक एआय म्हणजे मशीन लर्निंग. साधे रूप: डेटा फीड करणे, इनपुटपासून आउटपुटपर्यंत मॅपिंग शिकणे, नंतर नवीन गोष्टींचे सामान्यीकरण करणे. जादू नाही - गणित, गणना, आणि जर आपण प्रामाणिक असलो तर, एक चिमूटभर कला.


"एआय कसे काम करते?" ✅

जेव्हा लोक गुगलवर AI कसे काम करते? असे त्यांना सहसा असे हवे असते:

  • एक पुनर्वापरयोग्य मानसिक मॉडेल ज्यावर ते विश्वास ठेवू शकतात

  • मुख्य शिक्षण प्रकारांचा नकाशा जेणेकरून शब्दजाल भीतीदायक वाटणे थांबवेल.

  • हरवल्याशिवाय न्यूरल नेटवर्क्समध्ये डोकावून पहा

  • ट्रान्सफॉर्मर आता जग का चालवतात असे दिसते?

  • डेटा ते तैनातीपर्यंतचा व्यावहारिक मार्ग

  • एक जलद तुलना सारणी जी तुम्ही स्क्रीनशॉट घेऊ शकता आणि ठेवू शकता.

  • नैतिकता, पक्षपात आणि विश्वासार्हतेवरील रेलिंग जे हाताने हलणारे नाहीत

इथे तुम्हाला तेच मिळेल. जर मी भटकलो तर ते जाणूनबुजून असेल - जणू काही निसर्गरम्य मार्गाने जाणे आणि पुढच्या वेळी रस्ते चांगले लक्षात ठेवणे. 🗺️


बहुतेक एआय सिस्टीमचे मुख्य घटक 🧪

एआय सिस्टीम म्हणजे स्वयंपाकघर असा विचार करा. चार घटक वारंवार दिसतात:

  1. डेटा — लेबल्ससह किंवा त्याशिवाय उदाहरणे.

  2. मॉडेल — समायोज्य पॅरामीटर्ससह एक गणितीय कार्य.

  3. उद्दिष्ट — अंदाज किती वाईट आहेत हे मोजणारे नुकसान फंक्शन.

  4. ऑप्टिमायझेशन — एक अल्गोरिथम जो तोटा कमी करण्यासाठी पॅरामीटर्सना धक्का देतो.

सखोल शिक्षणात, तो धक्का सामान्यतः बॅकप्रोपॅगेशनसह ग्रेडियंट डिसेंट असतो - एका विशाल साउंडबोर्डवरील कोणता नॉब किंचाळला हे शोधण्याचा आणि नंतर तो अगदी खाली करण्याचा एक प्रभावी मार्ग [2] .

मिनी-केस: आम्ही एका ठिसूळ नियम-आधारित स्पॅम फिल्टरला एका लहान पर्यवेक्षित मॉडेलने बदलले. लेबल → मापन → अपडेट लूपच्या एका आठवड्यानंतर, खोटे पॉझिटिव्ह कमी झाले आणि समर्थन तिकिटे कमी झाली. काहीही फॅन्सी नाही - फक्त स्वच्छ उद्दिष्टे ("हॅम" ईमेलवरील अचूकता) आणि चांगले ऑप्टिमायझेशन.


एका दृष्टीक्षेपात शिकण्याच्या पद्धती 🎓

  • देखरेखीखाली शिक्षण
    तुम्ही इनपुट-आउटपुट जोड्या प्रदान करता (लेबल असलेले फोटो, स्पॅम/स्पॅम नाही असे चिन्हांकित केलेले ईमेल). मॉडेल इनपुट → आउटपुट शिकते. अनेक व्यावहारिक प्रणालींचा कणा [1].

  • देखरेखीशिवाय शिक्षण
    कोणतेही लेबले नाहीत. स्ट्रक्चर-क्लस्टर, कॉम्प्रेशन, सुप्त घटक शोधा. एक्सप्लोरेशन किंवा प्रीट्रेनिंगसाठी उत्तम.

  • स्व-पर्यवेक्षित शिक्षण
    हे मॉडेल स्वतःचे लेबले बनवते (पुढील शब्दाचा अंदाज लावा, गहाळ प्रतिमा पॅच). कच्च्या डेटाला मोठ्या प्रमाणात प्रशिक्षण सिग्नलमध्ये रूपांतरित करते; आधुनिक भाषा आणि दृष्टी मॉडेल्सना आधार देते.

  • मजबुतीकरण शिक्षण
    एजंट कृती करतो, बक्षिसे आणि संचयी बक्षिसे जास्तीत जास्त वाढवणारी धोरणे शिकतो. जर "मूल्य कार्ये," "धोरण" आणि "ऐहिक-फरक शिक्षण" हे घंटा वाजवत असतील तर - हे त्यांचे घर आहे [5].

हो, व्यवहारात या श्रेणी अस्पष्ट असतात. हायब्रिड पद्धती सामान्य आहेत. वास्तविक जीवन गोंधळलेले आहे; चांगले अभियांत्रिकी जिथे आहे तिथेच भेटते.


डोकेदुखीशिवाय न्यूरल नेटवर्कमध्ये 🧠

एक न्यूरल नेटवर्क लहान गणित युनिट्स (न्यूरॉन) चे थर एकत्र करते. प्रत्येक थर वजन, बायसेस आणि ReLU किंवा GELU सारख्या स्क्विशी नॉनलाइनियरिटीसह इनपुटचे रूपांतर करतो. सुरुवातीचे थर साधे वैशिष्ट्ये शिकतात; सखोल थर अ‍ॅबस्ट्रॅक्शन एन्कोड करतात. "जादू" - जर आपण त्याला म्हणू शकलो तर - रचना : लहान फंक्शन्सची साखळी करा आणि तुम्ही अत्यंत जटिल घटनांचे मॉडेल बनवू शकता.

प्रशिक्षण लूप, फक्त व्हायब्स:

  • अंदाज → त्रुटी मोजा → बॅकप्रॉपद्वारे दोष देणे → वजन कमी करा → पुनरावृत्ती करा.

हे वेगवेगळ्या बॅचेसमध्ये करा आणि, प्रत्येक गाण्यात सुधारणा करणाऱ्या अनाड़ी नर्तकाप्रमाणे, मॉडेल तुमच्या पायावर पाऊल ठेवणे थांबवते. मैत्रीपूर्ण, कठोर बॅकप्रॉप प्रकरणासाठी, [2] पहा.


ट्रान्सफॉर्मर्स का ताब्यात घेतले - आणि "लक्ष" म्हणजे काय 🧲

ट्रान्सफॉर्मर्स स्वतःकडे लक्ष इनपुटचे कोणते भाग एकमेकांसाठी महत्त्वाचे आहेत हे एकाच वेळी मोजतात. जुन्या मॉडेल्सप्रमाणे डावीकडून उजवीकडे वाक्य वाचण्याऐवजी, ट्रान्सफॉर्मर सर्वत्र पाहू शकतो आणि नातेसंबंधांचे गतिमानपणे मूल्यांकन करू शकतो - जसे की गर्दीच्या खोलीचे स्कॅनिंग करून कोण कोणाशी बोलत आहे हे पाहणे.

या डिझाइनमध्ये अनुक्रम मॉडेलिंगसाठी पुनरावृत्ती आणि वळणे वगळण्यात आली, ज्यामुळे मोठ्या प्रमाणात समांतरता आणि उत्कृष्ट स्केलिंग शक्य झाले. ज्या पेपरने ते सुरू केले - अटेंशन इज ऑल यू नीड - हे आर्किटेक्चर आणि निकालांची मांडणी करते [3].

एका ओळीत स्वतःकडे लक्ष देणे: क्वेरी , की आणि व्हॅल्यू वेक्टर बनवा; लक्ष वेधण्यासाठी समानता मोजा; त्यानुसार मूल्ये मिसळा. तपशीलांमध्ये गोंधळलेला, भावनेत सुंदर.

सावधान: ट्रान्सफॉर्मर्स वर्चस्व गाजवतात, मक्तेदारी नाही. सीएनएन, आरएनएन आणि ट्री एन्सेम्बल अजूनही काही डेटा प्रकार आणि लेटन्सी/किंमत मर्यादांवर विजय मिळवतात. कामासाठी आर्किटेक्चर निवडा, प्रचार नाही.


एआय कसे काम करते? तुम्ही प्रत्यक्षात वापरणार असलेली व्यावहारिक पाइपलाइन 🛠️

  1. समस्या मांडणे
    तुम्ही काय भाकित करत आहात किंवा निर्माण करत आहात आणि यश कसे मोजले जाईल?

  2. डेटा
    गोळा करा, आवश्यक असल्यास लेबल करा, साफ करा आणि विभाजित करा. गहाळ मूल्ये आणि एज केसेसची अपेक्षा करा.

  3. मॉडेलिंग
    सुरुवात सोपी करा. बेसलाइन्स (लॉजिस्टिक रिग्रेशन, ग्रेडियंट बूस्टिंग किंवा लहान ट्रान्सफॉर्मर) बहुतेकदा हिरोइक कॉम्प्लेक्सिटीला मागे टाकतात.

  4. प्रशिक्षण
    एक उद्दिष्ट निवडा, एक ऑप्टिमायझर निवडा, हायपरपॅरामीटर्स सेट करा. पुनरावृत्ती करा.

  5. मूल्यांकन
    तुमच्या खऱ्या ध्येयाशी जोडलेले होल्ड-आउट्स, क्रॉस-व्हॅलिडेशन आणि मेट्रिक्स वापरा (अचूकता, F1, AUROC, BLEU, गोंधळ, विलंब).

  6. तैनाती
    API च्या मागे सर्व्ह करा किंवा अॅपमध्ये एम्बेड करा. विलंब, खर्च, थ्रूपुट ट्रॅक करा.

  7. देखरेख आणि प्रशासन
    - निष्पक्षता, मजबूती आणि सुरक्षितता यावर लक्ष ठेवा. NIST AI जोखीम व्यवस्थापन फ्रेमवर्क (GOVERN, MAP, MEASURE, MANAGE) ही विश्वासार्ह प्रणालींसाठी एंड-टू-एंड [4] साठी एक व्यावहारिक चेकलिस्ट आहे.

मिनी-केस: एका व्हिजन मॉडेलने प्रयोगशाळेत प्रवेश केला, नंतर प्रकाश बदलला तेव्हा तो शेतात पडला. इनपुट हिस्टोग्राममध्ये फ्लॅग केलेल्या ड्रिफ्टचे निरीक्षण करणे; जलद वाढ + फाइन-ट्यून बंपमुळे कामगिरी पुनर्संचयित झाली. कंटाळवाणे? हो. प्रभावी? तसेच हो.


तुलना सारणी - दृष्टिकोन, ते कोणासाठी आहेत, ढोबळ किंमत, ते का काम करतात 📊

जाणूनबुजून अपूर्ण: थोडेसे असमान वाक्यरचना त्याला मानवी वाटण्यास मदत करते.

दृष्टिकोन आदर्श प्रेक्षक महागडा ते का काम करते / नोट्स
देखरेखीखाली शिक्षण विश्लेषक, उत्पादन संघ कमी-मध्यम डायरेक्ट मॅपिंग इनपुट→लेबल. लेबल्स अस्तित्वात असताना उत्तम; अनेक तैनात प्रणालींचा कणा बनतो [1].
देखरेखीशिवाय डेटा एक्सप्लोरर्स, संशोधन आणि विकास कमी क्लस्टर्स/कम्प्रेशन/अव्यक्त घटक शोधते - शोध आणि पूर्वप्रशिक्षणासाठी चांगले.
स्वतः देखरेख केलेले प्लॅटफॉर्म टीम्स मध्यम कच्च्या डेटा-स्केलपासून संगणक आणि डेटा वापरून स्वतःचे लेबल्स बनवते.
मजबुतीकरण शिक्षण रोबोटिक्स, ऑप्स संशोधन मध्यम ते उच्च रिवॉर्ड सिग्नलवरून धोरणे शिकतो; कॅननसाठी सटन आणि बार्टो वाचा [5].
ट्रान्सफॉर्मर्स एनएलपी, व्हिजन, मल्टीमॉडल मध्यम ते उच्च स्वतःकडे लक्ष देणे हे लांब पल्ल्याच्या उतारांना पकडते आणि चांगल्या प्रकारे समांतर करते; मूळ पेपर पहा [3].
क्लासिक एमएल (झाडे) टॅब्युलर बिझ अ‍ॅप्स कमी संरचित डेटावरील स्वस्त, जलद, अनेकदा धक्कादायकपणे मजबूत बेसलाइन.
नियम-आधारित/लाक्षणिक अनुपालन, निर्णायक खूप कमी पारदर्शक तर्कशास्त्र; जेव्हा तुम्हाला ऑडिटॅबिलिटीची आवश्यकता असते तेव्हा हायब्रिडमध्ये उपयुक्त.
मूल्यांकन आणि जोखीम प्रत्येकजण बदलते ते सुरक्षित आणि उपयुक्त ठेवण्यासाठी NIST चे GOVERN-MAP-MEASURE-MANAGE वापरा [4].

किंमत-इश = डेटा लेबलिंग + गणना + लोक + सेवा.


खोलवर जाणे १ - नुकसान कार्ये, ग्रेडियंट्स आणि सर्वकाही बदलणारे छोटे टप्पे 📉

आकारावरून घराच्या किमतीचा अंदाज लावण्यासाठी एक रेषा बसवण्याची कल्पना करा. तुम्ही पॅरामीटर्स (w) आणि (b) निवडा, अंदाज लावा (\hat{y} = wx + b) आणि सरासरी वर्ग नुकसानासह त्रुटी मोजा. ग्रेडियंट तुम्हाला कोणत्या दिशेने जायचे (w) आणि (b) नुकसान सर्वात जलद कमी करायचे ते सांगते - जसे की धुक्यात जमिनीचा उतार कोणत्या दिशेने आहे हे ओळखून उतारावर चालणे. प्रत्येक बॅचनंतर अपडेट करा आणि तुमची रेषा वास्तवाच्या जवळ जाईल.

डीप नेट्समध्ये मोठ्या बँडसह तेच गाणे असते. बॅकप्रॉप प्रत्येक लेयरच्या पॅरामीटर्सचा अंतिम त्रुटीवर कसा परिणाम झाला हे मोजते - कार्यक्षमतेने - जेणेकरून तुम्ही लाखो (किंवा अब्जावधी) नॉब्स योग्य दिशेने ढकलू शकता [2].

प्रमुख अंतर्ज्ञान:

  • नुकसान लँडस्केपला आकार देते.

  • ग्रेडियंट्स हे तुमचे कंपास आहेत.

  • शिकण्याचा वेग पावलांचा आकार खूप मोठा आहे - खूप मोठे आहे आणि तुम्ही डळमळीत आहात, खूप लहान आहे आणि तुम्ही झोपी जाता.

  • नियमितीकरणामुळे तुम्हाला प्रशिक्षण संच पोपटाप्रमाणे परिपूर्ण आठवणीसह लक्षात ठेवण्यापासून रोखले जाते पण समजत नाही.


खोलवर बुडी मारणे २ - एम्बेडिंग, प्रॉम्प्टिंग आणि रिट्रीव्हल 🧭

एम्बेड करणे जिथे समान गोष्टी एकमेकांजवळ येतात. ते तुम्हाला हे करू देते:

  • अर्थपूर्णदृष्ट्या समान परिच्छेद शोधा

  • अर्थ समजणारा पॉवर सर्च

  • रिट्रीव्हल-ऑगमेंटेड जनरेशन (RAG) प्लग इन करा जेणेकरून भाषा मॉडेल लिहिण्यापूर्वी तथ्ये शोधू शकेल.

प्रॉम्पटिंग म्हणजे जनरेटिव्ह मॉडेल्स चालवण्याचा मार्ग - कामाचे वर्णन करा, उदाहरणे द्या, मर्यादा सेट करा. खूप वेगवान इंटर्नसाठी खूप तपशीलवार स्पेक लिहिण्यासारखे विचार करा: उत्सुक, कधीकधी अतिआत्मविश्वासू.

व्यावहारिक सल्ला: जर तुमच्या मॉडेलमध्ये भ्रम निर्माण झाला असेल, तर पुनर्प्राप्ती जोडा, प्रॉम्प्ट कडक करा किंवा "व्हायब्स" ऐवजी ग्राउंडेड मेट्रिक्स वापरून मूल्यांकन करा.


खोलवर जाणे ३ - भ्रमाशिवाय मूल्यांकन 🧪

चांगले मूल्यांकन कंटाळवाणे वाटते - हाच मुद्दा आहे.

  • लॉक केलेला चाचणी संच वापरा.

  • वापरकर्त्याच्या वेदना प्रतिबिंबित करणारे एक मेट्रिक निवडा.

  • अ‍ॅबलेशन करा म्हणजे तुम्हाला कळेल की प्रत्यक्षात काय मदत झाली.

  • वास्तविक, गोंधळलेल्या उदाहरणांसह अपयशांची नोंद करा.

उत्पादनात, देखरेख हे मूल्यांकन आहे जे कधीही थांबत नाही. प्रवाह होतो. नवीन अपभाषा दिसून येते, सेन्सर्स पुन्हा कॅलिब्रेट केले जातात आणि कालचे मॉडेल थोडेसे सरकते. NIST फ्रेमवर्क हा चालू जोखीम व्यवस्थापन आणि प्रशासनासाठी एक व्यावहारिक संदर्भ आहे - धोरणात्मक दस्तऐवज नाही जो [4] ला बाजूला ठेवला जातो.


नीतिमत्ता, पक्षपात आणि विश्वासार्हतेबद्दल एक टीप ⚖️

एआय सिस्टीम त्यांच्या डेटा आणि तैनाती संदर्भाचे प्रतिबिंबित करतात. त्यामुळे धोका निर्माण होतो: पक्षपात, गटांमध्ये असमान त्रुटी, वितरण शिफ्ट अंतर्गत ठिसूळपणा. नैतिक वापर पर्यायी नाही - तो टेबल स्टेक्स आहे. NIST ठोस पद्धतींकडे निर्देश करते: जोखीम आणि परिणामांचे दस्तऐवजीकरण करणे, हानिकारक बायससाठी मोजमाप करणे, फॉलबॅक तयार करणे आणि जेव्हा स्टेक्स जास्त असतात तेव्हा मानवांना लूपमध्ये ठेवणे [4].

मदत करणाऱ्या ठोस हालचाली:

  • विविध, प्रातिनिधिक डेटा गोळा करा

  • उप-लोकसंख्येतील कामगिरी मोजा

  • दस्तऐवज मॉडेल कार्ड आणि डेटा शीट

  • जिथे जास्त धोका असेल तिथे मानवी देखरेख जोडा.

  • जेव्हा सिस्टम अनिश्चित असते तेव्हा फेल-सेफ डिझाइन करा


एआय कसे काम करते? मानसिक मॉडेल म्हणून तुम्ही पुन्हा वापरू शकता 🧩

जवळजवळ कोणत्याही एआय सिस्टीमसाठी तुम्ही लागू करू शकता अशी एक संक्षिप्त चेकलिस्ट:

  • उद्दिष्ट काय आहे? अंदाज, रँकिंग, निर्मिती, नियंत्रण?

  • शिकण्याचे संकेत कुठून येतात? लेबल्स, स्वतः देखरेख केलेली कामे, बक्षिसे?

  • कोणत्या वास्तुकलेचा वापर केला जातो? रेषीय मॉडेल, ट्री एन्सेम्बल, सीएनएन, आरएनएन, ट्रान्सफॉर्मर [3]?

  • ते कसे ऑप्टिमाइझ केले जाते? ग्रेडियंट डिसेंट व्हेरिएशन्स/बॅकप्रॉप [2]?

  • कोणती डेटा व्यवस्था? लहान लेबल केलेला संच, लेबल नसलेल्या मजकुराचा महासागर, नक्कल केलेले वातावरण?

  • अपयशाच्या पद्धती आणि सुरक्षिततेचे उपाय काय आहेत? पूर्वाग्रह, प्रवाह, भ्रम, विलंब, NIST च्या GOVERN-MAP-MEASURE-MANAGE [4] शी संबंधित खर्च.

जर तुम्ही त्यांची उत्तरे देऊ शकलात, तर तुम्हाला मुळात सिस्टम समजते - बाकीचे अंमलबजावणीचे तपशील आणि डोमेन ज्ञान आहे.


बुकमार्क करण्यासारखे जलद स्रोत 🔖

  • मशीन लर्निंग संकल्पनांचा साधा-भाषेचा परिचय (IBM) [1]

  • आकृत्या आणि सौम्य गणितासह पार्श्वप्रसार [2]

  • अनुक्रम मॉडेलिंग बदलणारा ट्रान्सफॉर्मर पेपर [3]

  • एनआयएसटीचा एआय रिस्क मॅनेजमेंट फ्रेमवर्क (व्यावहारिक प्रशासन) [4]

  • कॅनोनिकल रीइन्फोर्समेंट लर्निंग पाठ्यपुस्तक (मोफत) [5]


वारंवार विचारले जाणारे प्रश्न विजेचा गोल ⚡

एआय म्हणजे फक्त सांख्यिकी आहे का?
ते सांख्यिकी आणि ऑप्टिमायझेशन, गणना, डेटा अभियांत्रिकी आणि उत्पादन डिझाइन आहे. सांख्यिकी हा सांगाडा आहे; बाकीचा भाग स्नायू आहे.

मोठे मॉडेल नेहमीच जिंकतात का?
स्केलिंग मदत करते, परंतु डेटा गुणवत्ता, मूल्यांकन आणि उपयोजन मर्यादा बहुतेकदा अधिक महत्त्वाच्या असतात. तुमचे ध्येय साध्य करणारे सर्वात लहान मॉडेल सहसा वापरकर्ते आणि वॉलेटसाठी सर्वोत्तम असते.

एआय समजू शकतो का?
समजण्याची व्याख्या करा . मॉडेल्स डेटामध्ये रचना कॅप्चर करतात आणि प्रभावीपणे सामान्यीकरण करतात; परंतु त्यांच्याकडे काही अंध स्पॉट्स असतात आणि ते आत्मविश्वासाने चुकीचे असू शकतात. त्यांना शक्तिशाली साधनांसारखे वागवा - ऋषींसारखे नाही.

ट्रान्सफॉर्मर युग कायमचे आहे का?
कदाचित कायमचे नाही. मूळ पेपरमध्ये दाखवल्याप्रमाणे, लक्ष समांतर आणि चांगले स्केलिंग असल्याने ते आता प्रबळ आहे [3]. पण संशोधन पुढे जात राहते.


एआय कसे काम करते? खूप वेळ झाला, वाचले नाही 🧵

  • एआय डेटामधून पॅटर्न शिकते, नुकसान कमी करते आणि नवीन इनपुटमध्ये सामान्यीकरण करते [1,2].

  • पर्यवेक्षित, अपर्यवेक्षित, स्व-पर्यवेक्षित आणि मजबुतीकरण शिक्षण हे मुख्य प्रशिक्षण सेटअप आहेत; आरएल रिवॉर्ड्समधून शिकतो [5].

  • न्यूरल नेटवर्क लाखो पॅरामीटर्स कार्यक्षमतेने समायोजित करण्यासाठी बॅकप्रोपॅगेशन आणि ग्रेडियंट डिसेंट वापरतात [2].

  • ट्रान्सफॉर्मर्स अनेक क्रमिक कार्यांवर वर्चस्व गाजवतात कारण स्व-लक्षणे समांतर प्रमाणात संबंध कॅप्चर करते [3].

  • वास्तविक जगातील एआय ही समस्या तयार करण्यापासून ते तैनाती आणि प्रशासनापर्यंतची एक पाइपलाइन आहे - आणि एनआयएसटीची चौकट तुम्हाला जोखमीबद्दल प्रामाणिक ठेवते [4].

जर कोणी पुन्हा विचारले की एआय कसे काम करते?, तर तुम्ही हसून कॉफी पिऊ शकता आणि म्हणू शकता: ते डेटामधून शिकते, नुकसान कमी करते आणि समस्येनुसार ट्रान्सफॉर्मर किंवा ट्री एन्सेम्बल सारख्या आर्किटेक्चरचा वापर करते. नंतर एक नजर टाका, कारण ते सोपे आणि चोरटे पूर्ण आहे. 😉


संदर्भ

[1] आयबीएम - मशीन लर्निंग म्हणजे काय?
अधिक वाचा

[2] मायकेल निल्सन - बॅकप्रोपॅगेशन अल्गोरिथम कसे कार्य करते
अधिक वाचा

[3] वासवानी आणि इतर - लक्ष देणे हीच तुमची गरज आहे (arXiv)
अधिक वाचा

[4] NIST - आर्टिफिशियल इंटेलिजेंस रिस्क मॅनेजमेंट फ्रेमवर्क (AI RMF 1.0)
अधिक वाचा

[5] सटन आणि बार्टो - रीइन्फोर्समेंट लर्निंग: एक परिचय (दुसरी आवृत्ती)
अधिक वाचा

अधिकृत एआय असिस्टंट स्टोअरमध्ये नवीनतम एआय शोधा.

आमच्याबद्दल

ब्लॉगवर परत