एआयला त्याची माहिती कुठून मिळते?

तुम्ही कधी विचार करत बसला आहात का, की... या गोष्टी मुळात येतात तरी कुठून? म्हणजे, एआय काही ग्रंथालयातील धूळ खात पडलेली पुस्तकं चाळत नाही किंवा गुपचूप युट्यूबवरचे छोटे व्हिडिओ बघत नाही. तरीही, लसग्ना बनवण्याच्या सोप्या युक्त्यांपासून ते कृष्णविवराच्या भौतिकशास्त्रापर्यंत, जणू काही त्याच्या आत एक अथांग भांडारच आहे, अशा थाटात ते प्रत्येक गोष्टीची उत्तरं देतं. वास्तविकता तुम्ही लावलेल्या अंदाजापेक्षाही अधिक विचित्र आणि कदाचित जास्तच रंजक आहे. चला, यावर थोडं सविस्तर बोलूया (आणि हो, या दरम्यान काही गैरसमजही दूर करूया).

हे जादूटोणा आहे का? 🌐

ही काही जादू नाही, जरी कधीकधी तसे वाटत असले तरी. पडद्यामागे जे घडत आहे ते मूलतः पॅटर्न प्रेडिक्शन (नमुन्यांचा अंदाज ) आहे. लार्ज लँग्वेज मॉडेल्स (एलएलएम) तुमच्या मेंदूप्रमाणे तथ्ये साठवत नाहीत जसे तुमचा मेंदू तुमच्या आजीची कुकीची पाककृती लक्षात ठेवतो; त्याऐवजी, त्यांना आधी काय आले आहे याच्या आधारावर पुढचा शब्द (टोकन) ओळखण्यासाठी प्रशिक्षित केले जाते [2]. व्यवहारात, याचा अर्थ असा की ते संबंधांवर लक्ष केंद्रित करतात: कोणते शब्द एकत्र येतात, वाक्ये सहसा कशी तयार होतात, संपूर्ण कल्पना कशा प्रकारे सांगाड्याप्रमाणे तयार केल्या जातात. म्हणूनच आउटपुट योग्य वाटते , जरी - पूर्ण प्रामाणिकपणे सांगायचे तर - ते सांख्यिकीय नक्कल आहे, आकलन नाही [4].

तर मग एआय-व्युत्पन्न माहिती खरोखर उपयुक्त? काही गोष्टी:

डेटा विविधता - एका अरुंद प्रवाहातून नव्हे तर असंख्य स्रोतांमधून मिळवलेली माहिती.
अपडेट्स - रिफ्रेश सायकलशिवाय, ते लवकर जुने होते.
गाळणे - शक्यतो कचरा आत झिरपण्यापूर्वीच पकडणे (अर्थात, वास्तव पाहता, त्या जाळीला छिद्रे असतातच).
क्रॉस-चेकिंग - अधिकृत स्रोतांवर अवलंबून राहणे (नासा, डब्ल्यूएचओ, प्रमुख विद्यापीठे विचारात घ्या), जे बहुतेक एआय गव्हर्नन्स प्लेबुकमध्ये असणे आवश्यक आहे [3].

तरीही, कधीकधी ते आत्मविश्वासाने बनावट बनवते. ते तथाकथित भ्रम? मुळात सरळ तोंडाने पॉलिश केलेले मूर्खपणा [2][3].

या लेखानंतर तुम्हाला वाचायला आवडतील असे लेख:

🔗 एआय लॉटरीच्या संख्येचा अंदाज लावू शकते का?
एआय लॉटरी भाकितांविषयीच्या मिथकांचा आणि तथ्यांचा शोध घेणे.

🔗 एआयकडे समग्र दृष्टिकोन बाळगण्याचा अर्थ काय आहे?
नैतिकता आणि परिणाम यावर संतुलित दृष्टिकोन ठेवून एआय समजून घेणे.

🔗 बायबल कृत्रिम बुद्धिमत्तेबद्दल काय म्हणते?
तंत्रज्ञान आणि मानवी निर्मितीबद्दल बायबलमधील दृष्टिकोनांचे परीक्षण करणे.

जलद तुलना: एआय कुठून येते 📊

प्रत्येक स्रोत समान नसतो, परंतु प्रत्येकजण त्याची भूमिका बजावतो. येथे एक स्नॅपशॉट दृश्य आहे.

स्रोत प्रकार	कोण वापरते (AI)	किंमत/मूल्य	ते का काम करते (किंवा करत नाही...)
पुस्तके आणि लेख	मोठे भाषा मॉडेल	अमूल्य (अमूल्य)	सघन, संरचित ज्ञान - फक्त लवकर जुने होते.
वेबसाइट्स आणि ब्लॉग्ज	जवळजवळ सर्वच एआय	मोफत (आवाजासह)	जंगली विविधता; तेजस्वीपणा आणि परिपूर्ण कचरा यांचे मिश्रण.
शैक्षणिक पेपर्स	संशोधन-प्रधान एआय	कधीकधी पेवॉल केलेले	कठोरता + विश्वासार्हता, पण जड शब्दजालांमध्ये गुंतलेली.
वापरकर्ता डेटा	वैयक्तिकृत एआय	अत्यंत संवेदनशील ⚠️	हुशार टेलरिंग, पण गोपनीयतेची डोकेदुखी खूप आहे.
रिअल-टाइम वेब	शोध-लिंक्ड एआय	मोफत (ऑनलाइन असल्यास)	माहिती ताजी ठेवते; तोटा म्हणजे अफवांचा प्रसार होण्याचा धोका.

प्रशिक्षण डेटा विश्व 🌌

हा "बालपणीच्या शिक्षणाचा" टप्पा आहे. कल्पना करा की तुम्ही एका मुलाच्या हातात एकाच वेळी लाखो गोष्टींची पुस्तके, बातम्यांचे कात्रण आणि विकिपीडियावरील माहितीचे धागेदोरे देत आहात. पूर्व-प्रशिक्षण असेच दिसते. वास्तविक जगात, प्रदाते सार्वजनिकरित्या उपलब्ध डेटा, परवानाधारक स्रोत आणि प्रशिक्षकाने तयार केलेला मजकूर एकत्र करतात [2].

वर थर: क्युरेट केलेली मानवी उदाहरणे - चांगली उत्तरे, वाईट उत्तरे, योग्य दिशेने ढकलणे - मजबुतीकरण सुरू होण्यापूर्वीच [1].

पारदर्शकतेची खबरदारी: कंपन्या प्रत्येक तपशील उघड करत नाहीत. काही रेलिंग गुप्त असतात (आयपी, सुरक्षिततेच्या चिंता), त्यामुळे तुम्हाला प्रत्यक्ष मिश्रणात फक्त एक आंशिक विंडो मिळते [2].

रिअल-टाइम शोध: अतिरिक्त टॉपिंग 🍒

काही मॉडेल्स आता त्यांच्या ट्रेनिंग बबलच्या बाहेर डोकावू शकतात. याला रिट्रीव्हल-ऑगमेंटेड जनरेशन (RAG) म्हणतात- मुळात लाईव्ह इंडेक्स किंवा डॉक स्टोअरमधून चंक्स घेणे, आणि नंतर ते रिप्लायमध्ये विणणे [5]. बातम्यांचे हेडलाईन्स किंवा शेअरच्या किमतींसारख्या वेगाने बदलणाऱ्या गोष्टींसाठी उत्तम.

घाणेरडे? इंटरनेट हे प्रतिभा आणि कचरा यांच्यात समान भाग आहे. जर फिल्टर किंवा मूळ तपासणी कमकुवत असतील, तर जंक डेटा परत जाण्याचा धोका असतो - जोखीम फ्रेमवर्क ज्याबद्दल इशारा देतात [3].

एक सामान्य उपाय: कंपन्या मॉडेल्सना त्यांच्या स्वतःच्या अंतर्गत डेटाबेसशी जोडतात , जेणेकरून उत्तरे अंदाजे देण्याऐवजी सध्याच्या एचआर धोरणाचा किंवा अद्ययावत उत्पादन दस्तऐवजाचा संदर्भ दिला जातो. याचा परिणाम: गोंधळाचे क्षण कमी होतात आणि अधिक विश्वासार्ह उत्तरे मिळतात.

फाइन-ट्यूनिंग: एआयचे पॉलिशिंग पाऊल 🧪

कच्च्या प्रीट्रेन केलेले मॉडेल्स क्लिष्ट असतात. म्हणून ते अधिक चांगल्या प्रकारे तयार:

त्यांना उपयुक्त, निरुपद्रवी, प्रामाणिक राहण्यास शिकवणे (मानवी अभिप्रायातून बळकटी शिक्षणाद्वारे, RLHF) [1].
असुरक्षित किंवा विषारी कडा वाळूने भरणे (संरेखन) [1].
स्वरात बदल करणे - मग ते मैत्रीपूर्ण असो, औपचारिक असो किंवा विनोदी असो.

हे एखाद्या हिऱ्याला इतके पॉलिश करणे नाही तर एका सांख्यिकीय हिमस्खलनाला संभाषणाच्या जोडीदारासारखे वागण्यास भाग पाडणे आहे.

अडथळे आणि अपयश 🚧

आपण ते निर्दोष असल्याचे भासवू नये:

भ्रम - स्पष्ट उत्तरे जी अगदी चुकीची आहेत [2][3].
बायस - ते डेटामध्ये बेक केलेले पॅटर्न प्रतिबिंबित करते; अनचेक केले तर ते वाढवू शकते [3][4].
प्रत्यक्ष अनुभव नाही - ते सूपच्या पाककृतींबद्दल बोलू शकते पण कधीही चाखले नाही [4]
अतिआत्मविश्वास - गद्य असे वाहते जणू त्याला सर्व काही माहित आहे, जरी त्याला माहित नसले तरी. जोखीम फ्रेमवर्क संशयास्पद गृहितकांवर जोर देतात [3].

हे माहित असल्यासारखं का वाटतं 🧠

त्याला कोणत्याही समजुती नाहीत, मानवी अर्थाने कोणतीही स्मृती नाही आणि निश्चितपणे स्वतःचे अस्तित्वही नाही. तरीही ते वाक्ये सहजपणे एकत्र जोडत असल्यामुळे, तुमचा मेंदू ते समजल्यासारखे. येथे जे घडत आहे ते म्हणजे मोठ्या प्रमाणावर पुढील-टोकनचा अंदाज लावणे: काही क्षणांत अब्जावधी संभाव्यतांवर प्रक्रिया करणे [2].

"बुद्धिमत्ता" ही भावना उदयोन्मुख वर्तन आहे-संशोधक याला, थोड्या गंमतीने, "स्टोकास्टिक पॅरेट" प्रभाव म्हणतात [4].

मुलांसाठी अनुकूल उपमा 🎨

कल्पना करा की एका पोपटाने ग्रंथालयातील प्रत्येक पुस्तक वाचले आहे. त्याला कळत , पण तो शब्दांची अशी फेरफार करू शकतो की त्यातून काहीतरी शहाणपणाचे वाटेल. कधीकधी ते अगदी अचूक असते; कधीकधी ते निरर्थक असते - पण पुरेशा कौशल्याने, तुम्हाला नेहमीच त्यातील फरक ओळखता येत नाही.

शेवट: एआयची माहिती कुठून येते 📌

सोप्या भाषेत:

प्रचंड प्रशिक्षण डेटा (सार्वजनिक + परवानाधारक + प्रशिक्षक-निर्मित) [2].
स्वर/वर्तन आकार देण्यासाठी मानवी अभिप्रायासह फाइन-ट्यूनिंग [1]
लाइव्ह डेटा स्ट्रीमशी जोडल्यावर पुनर्प्राप्ती प्रणाली [5]

एआयला गोष्टी "माहित" नसतात - ते मजकुराचा अंदाज लावते. हीच त्याची महाशक्ती आणि त्याची सर्वात मोठी कमजोरी आहे. सारांश काय? महत्त्वाच्या गोष्टींची नेहमी एका विश्वसनीय स्रोताशी पडताळणी करा [3].

संदर्भ

ओयांग, एल. आणि इतर (२०२२). मानवी अभिप्रायासह सूचनांचे पालन करण्यासाठी भाषा मॉडेल्सना प्रशिक्षण देणे (InstructGPT). arXiv.
ओपनएआय (२०२३). जीपीटी-४ तांत्रिक अहवाल - परवानाधारक, सार्वजनिक आणि मानवनिर्मित डेटाचे मिश्रण; पुढील-टोकन अंदाज उद्दिष्ट आणि मर्यादा. arXiv.
NIST (२०२३). AI जोखीम व्यवस्थापन फ्रेमवर्क (AI RMF १.०) - मूळ, विश्वासार्हता आणि जोखीम नियंत्रणे. PDF.
बेंडर, ईएम, गेब्रू, टी., मॅकमिलन-मेजर, ए., मिचेल, एस. (२०२१). स्टोकास्टिक पोपटांच्या धोक्यांवर: भाषा मॉडेल खूप मोठे असू शकतात का? पीडीएफ.
लुईस, पी. एट अल. (२०२०). ज्ञान-गहन एनएलपीसाठी पुनर्प्राप्ती-संवर्धित पिढी. arXiv.

अधिकृत एआय असिस्टंट स्टोअरमध्ये नवीनतम एआय शोधा

आमच्याबद्दल

ब्लॉगवर परत