एआय मध्ये संगणक दृष्टी म्हणजे काय?

एआय मध्ये संगणक व्हिजन म्हणजे काय?

जर तुम्ही कधी तुमचा फोन तुमच्या चेहऱ्याने अनलॉक केला असेल, पावती स्कॅन केली असेल किंवा सेल्फ-चेकआउट कॅमेरा तुमच्या अ‍ॅव्होकॅडोचे मूल्यांकन करत आहे का असा प्रश्न विचारत असाल, तर तुम्ही संगणकाच्या दृष्टीला तोंड दिले आहे. सोप्या भाषेत सांगायचे तर, एआय मधील संगणक दृष्टी पाहण्यास आणि समजून घेण्यास शिकतात जेणेकरून निर्णय घेता येतील. उपयुक्त? नक्कीच. कधीकधी आश्चर्यकारक? तसेच हो. आणि प्रामाणिक असलो तर कधीकधी थोडे भयानक. सर्वोत्तम वेळी, ते गोंधळलेले पिक्सेल व्यावहारिक कृतींमध्ये बदलते. सर्वात वाईट वेळी, ते अंदाज लावते आणि डळमळीत होते. चला योग्यरित्या खोदून काढूया.

या लेखानंतर तुम्हाला वाचायला आवडतील असे लेख:

🔗 एआय बायस म्हणजे काय?
एआय सिस्टीममध्ये बायस कसा तयार होतो आणि तो शोधण्याचे आणि कमी करण्याचे मार्ग.

🔗 प्रेडिक्टिव्ह एआय म्हणजे काय?
ट्रेंड आणि परिणामांचा अंदाज घेण्यासाठी प्रेडिक्टिव्ह एआय डेटा कसा वापरते.

🔗 एआय ट्रेनर म्हणजे काय?
एआय प्रशिक्षण देणाऱ्या व्यावसायिकांनी वापरलेल्या जबाबदाऱ्या, कौशल्ये आणि साधने.

🔗 गुगल व्हर्टेक्स एआय म्हणजे काय?
मॉडेल्स तयार करण्यासाठी आणि तैनात करण्यासाठी गुगलच्या युनिफाइड एआय प्लॅटफॉर्मचा आढावा.


एआय मध्ये संगणक व्हिजन म्हणजे नेमके काय? 📸

एआय मधील संगणक व्हिजन ही कृत्रिम बुद्धिमत्तेची एक शाखा आहे जी संगणकांना दृश्य डेटाचे अर्थ लावण्यास आणि तर्क करण्यास शिकवते. ही कच्च्या पिक्सेलपासून संरचित अर्थापर्यंतची पाइपलाइन आहे: “हे एक थांबण्याचे चिन्ह आहे,” “ते पादचारी आहेत,” “वेल्ड दोषपूर्ण आहे,” “इनव्हॉइस टोटल येथे आहे.” यात वर्गीकरण, शोध, विभाजन, ट्रॅकिंग, खोली अंदाज, ओसीआर आणि पॅटर्न-लर्निंग मॉडेल्सद्वारे एकत्रितपणे जोडलेल्या कार्यांचा समावेश आहे. औपचारिक क्षेत्र क्लासिक भूमिती ते आधुनिक सखोल शिक्षणापर्यंत पसरलेले आहे, व्यावहारिक प्लेबुकसह तुम्ही कॉपी आणि ट्विक करू शकता. [1]

एक छोटीशी गोष्ट: एका साध्या ७२०p कॅमेरा असलेल्या पॅकेजिंग लाईनची कल्पना करा. हलक्या वजनाचा डिटेक्टर कॅप्स शोधतो आणि एक साधा ट्रॅकर बाटलीला हिरवा दिवा लावण्यापूर्वी ते सलग पाच फ्रेम्ससाठी संरेखित असल्याची पुष्टी करतो. फॅन्सी नाही - पण स्वस्त, जलद आणि त्यामुळे पुन्हा काम करणे कमी होते.


एआय मध्ये संगणक व्हिजन कशामुळे उपयुक्त ठरते? ✅

  • सिग्नल-टू-अ‍ॅक्शन फ्लो : व्हिज्युअल इनपुट एक कृतीशील आउटपुट बनते. कमी डॅशबोर्ड, अधिक निर्णय.

  • सामान्यीकरण : योग्य डेटासह, एक मॉडेल विविध प्रकारच्या प्रतिमा हाताळतो. परिपूर्ण नाही - कधीकधी धक्कादायकपणे चांगले.

  • डेटा लीव्हरेज : कॅमेरे स्वस्त आहेत आणि सर्वत्र उपलब्ध आहेत. व्हिजन पिक्सेलच्या त्या महासागराला अंतर्दृष्टीमध्ये बदलते.

  • वेग : मॉडेल्स टास्क आणि रिझोल्यूशनवर अवलंबून, सामान्य हार्डवेअरवर रिअल टाइममध्ये किंवा जवळजवळ रिअल टाइममध्ये फ्रेम्सवर प्रक्रिया करू शकतात.

  • कंपोझिबिलिटी : विश्वासार्ह प्रणालींमध्ये सोप्या पायऱ्यांची साखळी: शोध → ट्रॅकिंग → गुणवत्ता नियंत्रण.

  • परिसंस्था : साधने, पूर्वप्रशिक्षित मॉडेल्स, बेंचमार्क आणि समुदाय समर्थन - कोडचा एक विस्तीर्ण बाजार.

प्रामाणिकपणे सांगायचे तर, गुप्त गोष्ट गुप्त नाही: चांगला डेटा, शिस्तबद्ध मूल्यांकन, काळजीपूर्वक वापर. बाकी सराव आहे... आणि कदाचित कॉफी. ☕


एआय मध्ये संगणक व्हिजन कसे कार्य करते, एका सुज्ञ पाइपलाइनमध्ये 🧪

  1. प्रतिमा संपादन
    कॅमेरे, स्कॅनर, ड्रोन, फोन. सेन्सर प्रकार, एक्सपोजर, लेन्स आणि फ्रेम रेट काळजीपूर्वक निवडा. कचरा आत टाका, इ.

  2. प्रीप्रोसेसिंग
    गरज पडल्यास आकार बदला, क्रॉप करा, सामान्य करा, डीब्लर करा किंवा आवाज कमी करा. कधीकधी एक छोटासा कॉन्ट्रास्ट ट्विक पर्वत हलवतो. [4]

  3. लेबल्स आणि डेटासेट्स
    बाउंडिंग बॉक्स, बहुभुज, कीपॉइंट्स, टेक्स्ट स्पॅन. संतुलित, प्रतिनिधी लेबल्स - किंवा तुमचे मॉडेल एकांगी सवयी शिकते.

  4. मॉडेलिंग

    • वर्गीकरण : "कोणत्या श्रेणीत?"

    • शोध : "वस्तू कुठे आहेत?"

    • विभाजन : “कोणते पिक्सेल कोणत्या वस्तूचे आहेत?”

    • मुख्य मुद्दे आणि पोझ : "सांधे किंवा खुणा कुठे आहेत?"

    • OCR : “चित्रात कोणता मजकूर आहे?”

    • खोली आणि 3D : "सर्व काही किती दूर आहे?"
      आर्किटेक्चर वेगवेगळे असतात, परंतु कन्व्होल्यूशनल जाळे आणि ट्रान्सफॉर्मर-शैलीतील मॉडेल्स वर्चस्व गाजवतात. [1]

  5. प्रशिक्षण
    डेटा विभाजित करा, हायपरपॅरामीटर्स ट्यून करा, नियमित करा, वाढवा. वॉलपेपर लक्षात ठेवण्यापूर्वी लवकर थांबा.

  6. मूल्यांकन
    OCR साठी mAP, IoU, F1, CER/WER सारखे कार्य-योग्य मेट्रिक्स वापरा. ​​चेरी-पिक करू नका. निष्पक्ष तुलना करा. [3]


  7. लक्ष्यासाठी तैनाती

मोठे डेटासेट आणि संगणकीय घटकांनी क्रिटिकल मास गाठल्यानंतर डीप नेटने गुणात्मक झेप घेतली. इमेजनेट चॅलेंज सारख्या बेंचमार्कमुळे ती प्रगती दृश्यमान आणि अथक झाली. [2]


तुम्ही प्रत्यक्षात वापरणार असलेली (आणि केव्हा) मुख्य कामे 🧩

  • प्रतिमा वर्गीकरण : प्रति प्रतिमा एक लेबल. जलद फिल्टर, ट्रायएज किंवा दर्जेदार गेट्ससाठी वापरा.

  • वस्तू शोधणे : वस्तूंभोवती खोके. किरकोळ नुकसान रोखणे, वाहन शोधणे, वन्यजीवांची संख्या.

  • उदाहरण विभागणी : प्रत्येक वस्तूसाठी पिक्सेल-अचूक छायचित्रे. उत्पादन दोष, शस्त्रक्रिया साधने, कृषी तंत्रज्ञान.

  • अर्थपूर्ण विभाजन : उदाहरणे वेगळे न करता प्रति पिक्सेल वर्ग. शहरी रस्त्यांचे दृश्ये, जमिनीचे आवरण.

  • कीपॉइंट डिटेक्शन आणि पोझ : सांधे, खुणा, चेहऱ्याची वैशिष्ट्ये. क्रीडा विश्लेषण, एर्गोनॉमिक्स, एआर.

  • ट्रॅकिंग : कालांतराने वस्तूंचे अनुसरण करा. लॉजिस्टिक्स, रहदारी, सुरक्षा.

  • ओसीआर आणि डॉक्युमेंट एआय : टेक्स्ट एक्सट्रॅक्शन आणि लेआउट पार्सिंग. इनव्हॉइस, पावत्या, फॉर्म.

  • खोली आणि 3D : अनेक दृश्ये किंवा मोनोक्युलर संकेतांमधून पुनर्बांधणी. रोबोटिक्स, एआर, मॅपिंग.

  • दृश्य मथळे : नैसर्गिक भाषेत दृश्यांचा सारांश द्या. प्रवेशयोग्यता, शोध.

  • दृष्टी-भाषा मॉडेल्स : बहुआयामी तर्क, पुनर्प्राप्ती-संवर्धित दृष्टी, ग्राउंडेड क्यूए.

लहान केस व्हाइब: दुकानांमध्ये, डिटेक्टर शेल्फ फेसिंग गहाळ असल्याचे दर्शवितो; ट्रॅकर स्टाफ रिस्टॉक म्हणून दुहेरी मोजणी रोखतो; एक साधा नियम कमी आत्मविश्वास असलेल्या फ्रेम्सना मानवी पुनरावलोकनाकडे वळवतो. हा एक लहान ऑर्केस्ट्रा आहे जो बहुतेक वेळा सुसंगत राहतो.


तुलना सारणी: जलद पाठवण्यासाठी साधने 🧰

मुद्दामहून थोडे विचित्र. हो, अंतर विचित्र आहे - मला माहिती आहे.

साधन / फ्रेमवर्क साठी सर्वोत्तम परवाना/किंमत ते व्यवहारात का काम करते
ओपनसीव्ही प्रीप्रोसेसिंग, क्लासिक सीव्ही, जलद पीओसी मोफत - मुक्त स्रोत प्रचंड टूलबॉक्स, स्थिर API, युद्ध-चाचणी केलेले; कधीकधी तुम्हाला आवश्यक असलेले सर्व. [4]
पायटॉर्च संशोधन-अनुकूल प्रशिक्षण मोफत गतिमान आलेख, प्रचंड परिसंस्था, अनेक ट्यूटोरियल.
टेन्सरफ्लो/केरास मोठ्या प्रमाणात उत्पादन मोफत प्रौढ सर्व्हिंग पर्याय, मोबाईल आणि एजसाठी देखील चांगले.
अल्ट्रालाइटिक्स योलो जलद ऑब्जेक्ट शोधणे मोफत + सशुल्क अ‍ॅड-ऑन सोपे प्रशिक्षण चक्र, स्पर्धात्मक वेग-अचूकता, मतप्रिय पण आरामदायी.
डिटेक्टरॉन२ / एमएमडिटेक्शन मजबूत बेसलाइन, विभाजन मोफत पुनरुत्पादनक्षम परिणामांसह संदर्भ-श्रेणी मॉडेल.
ओपनव्हिनो / ओएनएक्स रनटाइम अनुमान ऑप्टिमायझेशन मोफत पुन्हा लिहिल्याशिवाय विलंब दाबा, व्यापकपणे तैनात करा.
टेसरॅक्ट बजेटमध्ये ओसीआर मोफत जर तुम्ही प्रतिमा स्वच्छ केली तर ते चांगले काम करते... कधीकधी तुम्हाला खरोखरच करायला हवे.

एआय मध्ये संगणक व्हिजन मध्ये गुणवत्तेला काय चालना देते 🔧

  • डेटा कव्हरेज : प्रकाश बदल, कोन, पार्श्वभूमी, कडा केसेस. जर ते होऊ शकत असेल तर ते समाविष्ट करा.

  • लेबलची गुणवत्ता : विसंगत बॉक्स किंवा ढिले बहुभुज मॅपला खराब करतात. थोडासा क्यूए खूप मदत करतो.

  • स्मार्ट ऑग्मेंटेशन्स : क्रॉप करा, फिरवा, चमक वाढवा, कृत्रिम आवाज जोडा. वास्तववादी व्हा, यादृच्छिक गोंधळ नाही.

  • मॉडेल-सिलेक्शन फिट : जिथे डिटेक्शन आवश्यक असेल तिथे डिटेक्शन वापरा - क्लासिफायरला स्थानांचा अंदाज घेण्यास भाग पाडू नका.

  • परिणामांशी जुळणारे मेट्रिक्स : जर खोटे निगेटिव्ह जास्त नुकसान करत असतील, तर रिकॉल ऑप्टिमाइझ करा. जर खोटे पॉझिटिव्ह जास्त नुकसान करत असतील, तर प्रथम अचूकता.

  • कडक फीडबॅक लूप : अपयश नोंदवा, पुन्हा लेबल करा, पुन्हा प्रशिक्षण द्या. स्वच्छ धुवा, पुन्हा करा. थोडे कंटाळवाणे-अत्यंत प्रभावी.

शोध/विभाजनासाठी, समुदाय मानक म्हणजे IoU थ्रेशोल्ड्स-उर्फ COCO-शैलीतील mAP सरासरी अचूकता . IoU आणि AP@{0.5:0.95} कसे मोजले जातात हे जाणून घेतल्याने लीडरबोर्ड दावे तुम्हाला दशांशांनी चकित करणार नाहीत. [3]


काल्पनिक नसलेली वास्तविक वापराची प्रकरणे 🌍

  • किरकोळ विक्री : शेल्फ विश्लेषण, नुकसान प्रतिबंध, रांगेचे निरीक्षण, प्लॅनोग्राम अनुपालन.

  • उत्पादन : पृष्ठभागावरील दोष शोधणे, असेंब्ली पडताळणी, रोबोट मार्गदर्शन.

  • आरोग्यसेवा : रेडिओलॉजी ट्रायएज, इन्स्ट्रुमेंट डिटेक्शन, सेल सेगमेंटेशन.

  • गतिशीलता : ADAS, ट्रॅफिक कॅम्स, पार्किंग ऑक्युपन्सी, मायक्रोमोबिलिटी ट्रॅकिंग.

  • शेती : पीक गणना, रोगांचे निदान, कापणीची तयारी.

  • विमा आणि वित्त : नुकसान मूल्यांकन, केवायसी तपासणी, फसवणूक ध्वज.

  • बांधकाम आणि ऊर्जा : सुरक्षिततेचे पालन, गळती शोधणे, गंज निरीक्षण.

  • सामग्री आणि प्रवेशयोग्यता : स्वयंचलित मथळे, नियंत्रण, दृश्य शोध.

तुम्हाला दिसेल असा नमुना: मॅन्युअल स्कॅनिंगला ऑटोमॅटिक ट्रायजने बदला, नंतर आत्मविश्वास कमी झाल्यावर ते मानवी स्कॅनिंगकडे नेले जाते. आकर्षक नाही - पण ते वाढते.


डेटा, लेबल्स आणि महत्त्वाचे मेट्रिक्स 📊

  • वर्गीकरण : अचूकता, असंतुलनासाठी F1.

  • शोध : IoU थ्रेशोल्ड ओलांडून mAP; प्रति-वर्ग AP आणि आकाराच्या बादल्यांचे निरीक्षण करा. [3]

  • विभाजन : mIoU, डाइस; इन्स्टन्स-लेव्हल एरर देखील तपासा.

  • ट्रॅकिंग : MOTA, IDF1; पुन्हा ओळखण्याची गुणवत्ता ही मूक नायक आहे.

  • ओसीआर : कॅरेक्टर एरर रेट (सीईआर) आणि वर्ड एरर रेट (डब्ल्यूईआर); लेआउट अपयश बहुतेकदा वर्चस्व गाजवतात.

  • प्रतिगमन कार्ये : खोली किंवा पोझमध्ये निरपेक्ष/सापेक्ष त्रुटी वापरल्या जातात (बहुतेकदा लॉग स्केलवर).

तुमच्या मूल्यांकन प्रोटोकॉलचे दस्तऐवजीकरण करा जेणेकरून इतर ते पुन्हा करू शकतील. ते अश्लील आहे - परंतु ते तुम्हाला प्रामाणिक ठेवते.


बांधणे विरुद्ध खरेदी करणे - आणि ते कुठे चालवायचे 🏗️

  • क्लाउड : सुरुवात करणे सर्वात सोपे, बॅच वर्कलोडसाठी उत्तम. बाहेर पडण्याच्या खर्चावर लक्ष ठेवा.

  • एज डिव्हाइसेस : कमी विलंब आणि चांगली गोपनीयता. तुम्हाला क्वांटायझेशन, प्रुनिंग आणि अ‍ॅक्सिलरेटर्सची काळजी असेल.

  • डिव्हाइसवरील मोबाइल : जेव्हा ते बसते तेव्हा आश्चर्यकारक. मॉडेल्स आणि घड्याळाची बॅटरी ऑप्टिमाइझ करा.

  • हायब्रिड : काठावर प्री-फिल्टर, क्लाउडमध्ये जड वस्तू उचलणे. एक छान तडजोड.

एक कंटाळवाणा विश्वासार्ह स्टॅक: PyTorch सह प्रोटोटाइप, एक मानक डिटेक्टर प्रशिक्षित करा, ONNX ला निर्यात करा, OpenVINO/ONNX रनटाइमसह प्रवेग वाढवा आणि प्रीप्रोसेसिंग आणि भूमितीसाठी OpenCV वापरा (कॅलिब्रेशन, होमोग्राफी, मॉर्फोलॉजी). [4]


जोखीम, नीतिमत्ता आणि ज्या गोष्टींबद्दल बोलणे कठीण आहे ⚖️

व्हिजन सिस्टीम डेटासेट बायसेस किंवा ऑपरेशनल ब्लाइंड स्पॉट्स वारशाने मिळवू शकतात. स्वतंत्र मूल्यांकनांनी (उदा., NIST FRVT) अल्गोरिदम आणि परिस्थितींमध्ये चेहरा ओळखण्याच्या त्रुटी दरांमध्ये लोकसंख्याशास्त्रीय फरक मोजला आहे. हे घाबरण्याचे कारण नाही, परंतु काळजीपूर्वक चाचणी करणे, मर्यादा दस्तऐवजीकरण करणे आणि उत्पादनात सतत निरीक्षण करणे हे आहे . जर तुम्ही ओळख- किंवा सुरक्षिततेशी संबंधित वापर प्रकरणे तैनात केली तर मानवी पुनरावलोकन आणि अपील यंत्रणा समाविष्ट करा. गोपनीयता, संमती आणि पारदर्शकता हे पर्यायी अतिरिक्त नाहीत. [5]


तुम्ही प्रत्यक्षात अनुसरण करू शकता असा जलद-सुरुवात रोडमॅप 🗺️

  1. निर्णयाची व्याख्या करा
    प्रतिमा पाहिल्यानंतर सिस्टमने कोणती कारवाई करावी? हे तुम्हाला व्हॅनिटी मेट्रिक्स ऑप्टिमाइझ करण्यापासून रोखते.

  2. एक स्क्रॅपी डेटासेट गोळा करा
    तुमच्या वास्तविक वातावरणाचे प्रतिबिंब असलेल्या काहीशे प्रतिमांसह सुरुवात करा. काळजीपूर्वक लेबल करा - जरी ते तुम्ही आणि तीन स्टिकी नोट्स असलात तरीही.

  3. बेसलाइन मॉडेल निवडा
    पूर्व-प्रशिक्षित वजनांसह एक साधा पाठीचा कणा निवडा. अद्याप विदेशी आर्किटेक्चरचा पाठलाग करू नका. [1]


  4. ट्रॅक मेट्रिक्स, गोंधळ बिंदू आणि अपयश मोड्स प्रशिक्षित करा, लॉग करा, मूल्यांकन करा

  5. लूप घट्ट करा
    हार्ड निगेटिव्ह जोडा, लेबल ड्रिफ्ट दुरुस्त करा, ऑगमेंटेशन समायोजित करा आणि थ्रेशोल्ड पुन्हा ट्यून करा. थोडे बदल होतात. [3]

  6. स्लिम व्हर्जन डिप्लॉय करा
    क्वांटाइझ करा आणि एक्सपोर्ट करा. खेळण्यांच्या बेंचमार्कमध्ये नाही तर वास्तविक वातावरणात लेटन्सी/थ्रूपुट मोजा.

  7. निरीक्षण करा आणि पुनरावृत्ती करा
    चुका गोळा करा, पुन्हा लेबल करा, पुन्हा प्रशिक्षण द्या. नियतकालिक मूल्यांकनांचे वेळापत्रक तयार करा जेणेकरून तुमचे मॉडेल जीवाश्म होणार नाही.

प्रो टिप: तुमच्या सर्वात निंदक टीममेटने सेट केलेल्या एका लहान होल्डआउटवर भाष्य करा. जर ते त्यात छिद्र पाडू शकत नसतील तर तुम्ही कदाचित तयार आहात.


तुम्हाला टाळायच्या असलेल्या सामान्य गोष्टी 🧨

  • स्वच्छ स्टुडिओ प्रतिमांवर प्रशिक्षण, लेन्सवर पाऊस पडून वास्तविक जगात तैनात करणे.

  • जेव्हा तुम्हाला खरोखरच एका गंभीर वर्गाची काळजी असते तेव्हा एकूण mAP साठी ऑप्टिमायझेशन करणे. [3]

  • वर्ग असमतोल दुर्लक्षित करणे आणि नंतर दुर्मिळ घटना का गायब होतात याचा विचार करणे.

  • मॉडेल कृत्रिम कलाकृती शिकत नाही तोपर्यंत अति-वृद्धी.

  • कॅमेरा कॅलिब्रेशन वगळणे आणि नंतर दृष्टीकोनातील त्रुटींशी कायमचा लढा देणे. [4]

  • अचूक मूल्यांकन सेटअपची प्रतिकृती न बनवता लीडरबोर्ड क्रमांकांवर विश्वास ठेवणे. [2][3]


बुकमार्क करण्यासारखे स्रोत 🔗

जर तुम्हाला प्राथमिक साहित्य आणि अभ्यासक्रमाच्या नोट्स आवडत असतील, तर हे मूलभूत गोष्टी, सराव आणि बेंचमार्कसाठी सोने आहे. संदर्भ विभाग पहा: CS231n नोट्स, इमेजनेट चॅलेंज पेपर, COCO डेटासेट/मूल्यांकन दस्तऐवज, OpenCV दस्तऐवज आणि NIST FRVT अहवाल. [1][2][3][4][5]


शेवटचे भाष्य - किंवा खूप लांब, वाचले नाही 🍃

एआय मधील संगणक व्हिजन पिक्सेलला निर्णयांमध्ये बदलते. जेव्हा तुम्ही योग्य कार्य योग्य डेटाशी जोडता, योग्य गोष्टी मोजता आणि असामान्य शिस्तीने पुनरावृत्ती करता तेव्हा ते चमकते. टूलिंग उदार आहे, बेंचमार्क सार्वजनिक आहेत आणि जर तुम्ही अंतिम निर्णयावर लक्ष केंद्रित केले तर प्रोटोटाइपपासून उत्पादनापर्यंतचा मार्ग आश्चर्यकारकपणे लहान आहे. तुमचे लेबल्स सरळ करा, परिणामाशी जुळणारे मेट्रिक्स निवडा आणि मॉडेल्सना हेवी लिफ्टिंग करू द्या. आणि जर एखादा रूपक मदत करत असेल तर - ते म्हणजे एखाद्या अतिशय जलद परंतु शाब्दिक इंटर्नला काय महत्त्वाचे आहे ते ओळखण्यासाठी शिकवणे. तुम्ही उदाहरणे दाखवता, चुका दुरुस्त करता आणि हळूहळू खऱ्या कामावर विश्वास ठेवता. परिपूर्ण नाही, परंतु परिवर्तनकारी होण्यासाठी पुरेसे जवळ आहे. 🌟


संदर्भ

  1. CS231n: संगणक दृष्टीसाठी सखोल शिक्षण (कोर्स नोट्स) - स्टॅनफोर्ड विद्यापीठ.
    अधिक वाचा

  2. इमेजनेट लार्ज स्केल व्हिज्युअल रिकग्निशन चॅलेंज (पेपर) - रुसाकोव्स्की आणि इतर.
    अधिक वाचा

  3. COCO डेटासेट आणि मूल्यांकन - अधिकृत साइट (कार्य व्याख्या आणि mAP/IoU अधिवेशने).
    अधिक वाचा

  4. ओपनसीव्ही डॉक्युमेंटेशन (v4.x) - प्रीप्रोसेसिंग, कॅलिब्रेशन, मॉर्फोलॉजी इत्यादींसाठी मॉड्यूल.
    अधिक वाचा

  5. NIST FRVT भाग ३: लोकसंख्याशास्त्रीय परिणाम (NISTIR 8280) - लोकसंख्याशास्त्रातील चेहरा ओळखण्याच्या अचूकतेचे स्वतंत्र मूल्यांकन.
    अधिक वाचा

अधिकृत एआय असिस्टंट स्टोअरमध्ये नवीनतम एआय शोधा.

आमच्याबद्दल

ब्लॉगवर परत