ប្រសិនបើអ្នកធ្លាប់ដោះសោទូរស័ព្ទរបស់អ្នកដោយប្រើមុខរបស់អ្នក ស្កេនបង្កាន់ដៃ ឬសម្លឹងមើលកាមេរ៉ាទូទាត់ប្រាក់ដោយខ្លួនឯងដោយឆ្ងល់ថាតើវាកំពុងវិនិច្ឆ័យផ្លែបឺររបស់អ្នកឬអត់ អ្នកបានប្រឆាំងនឹងចក្ខុវិស័យកុំព្យូទ័រហើយ។ និយាយឱ្យសាមញ្ញទៅ ចក្ខុវិស័យកុំព្យូទ័រនៅក្នុង AI គឺជារបៀបដែលម៉ាស៊ីនរៀន មើលឃើញ និង យល់ រូបភាព និងវីដេអូបានល្អគ្រប់គ្រាន់ដើម្បីធ្វើការសម្រេចចិត្ត។ មានប្រយោជន៍? ពិតជាមានមែន។ ពេលខ្លះគួរឱ្យភ្ញាក់ផ្អើល? មែនហើយដែរ។ ហើយពេលខ្លះគួរឱ្យខ្លាចបន្តិចប្រសិនបើយើងនិយាយដោយស្មោះត្រង់។ ក្នុងករណីល្អបំផុត វាប្រែក្លាយភីកសែលរញ៉េរញ៉ៃទៅជាសកម្មភាពជាក់ស្តែង។ ក្នុងករណីអាក្រក់បំផុត វាទាយ និងរង្គើ។ ចូរយើងស្វែងយល់ឱ្យបានត្រឹមត្រូវ។
អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖
🔗 តើភាពលំអៀងនៃ AI ជាអ្វី?
របៀបដែលភាពលំអៀងកើតឡើងនៅក្នុងប្រព័ន្ធ AI និងវិធីដើម្បីរកឃើញ និងកាត់បន្ថយវា។
🔗 តើ AI ព្យាករណ៍ជាអ្វី?
របៀបដែល AI ព្យាករណ៍ប្រើប្រាស់ទិន្នន័យដើម្បីព្យាករណ៍និន្នាការ និងលទ្ធផល។
🔗 តើគ្រូបង្វឹក AI ជាអ្វី?
ទំនួលខុសត្រូវ ជំនាញ និងឧបករណ៍ដែលប្រើប្រាស់ដោយអ្នកជំនាញដែលបណ្តុះបណ្តាល AI។
🔗 តើ Google Vertex AI ជាអ្វី?
ទិដ្ឋភាពទូទៅនៃវេទិកា AI បង្រួបបង្រួមរបស់ Google សម្រាប់ការបង្កើត និងដាក់ពង្រាយគំរូ។
តើចក្ខុវិស័យកុំព្យូទ័រក្នុងបញ្ញាសិប្បនិម្មិត (AI) ជាអ្វីឲ្យប្រាកដ? 📸
ចក្ខុវិស័យកុំព្យូទ័រនៅក្នុង AI គឺជាសាខានៃបញ្ញាសិប្បនិម្មិតដែលបង្រៀនកុំព្យូទ័រឱ្យបកស្រាយ និងវែកញែកអំពីទិន្នន័យដែលមើលឃើញ។ វាគឺជាបំពង់បង្ហូរពីភីកសែលឆៅទៅជាអត្ថន័យដែលមានរចនាសម្ព័ន្ធ៖ "នេះជាសញ្ញាឈប់" "អ្នកទាំងនោះជាអ្នកថ្មើរជើង" "ការផ្សារមានបញ្ហា" "ចំនួនសរុបវិក្កយបត្រនៅទីនេះ"។ វាគ្របដណ្តប់លើភារកិច្ចដូចជាការចាត់ថ្នាក់ ការរកឃើញ ការបែងចែក ការតាមដាន ការប៉ាន់ស្មានជម្រៅ OCR និងច្រើនទៀតដែលដេរភ្ជាប់គ្នាដោយគំរូរៀនលំនាំ។ វិស័យផ្លូវការគ្របដណ្តប់លើធរណីមាត្របុរាណរហូតដល់ការរៀនស៊ីជម្រៅទំនើប ជាមួយនឹងសៀវភៅណែនាំជាក់ស្តែងដែលអ្នកអាចចម្លង និងកែសម្រួលបាន។ [1]
រឿងខ្លីមួយ៖ ស្រមៃមើលខ្សែសង្វាក់វេចខ្ចប់មួយដែលមានកាមេរ៉ាកម្រិត 720p តូចមួយ។ ឧបករណ៍ចាប់សញ្ញាទម្ងន់ស្រាលមួយអាចរកឃើញសញ្ញាសម្គាល់ ហើយឧបករណ៍តាមដានសាមញ្ញមួយបញ្ជាក់ថាពួកវាត្រូវបានតម្រឹមគ្នាសម្រាប់ស៊ុមប្រាំជាប់ៗគ្នា មុនពេលបើកភ្លើងខៀវសម្រាប់ដប។ មិនទំនើបទេ ប៉ុន្តែថោក លឿន និងកាត់បន្ថយការងារឡើងវិញ។
តើអ្វីទៅដែលធ្វើឱ្យចក្ខុវិស័យកុំព្យូទ័រក្នុង AI មានប្រយោជន៍? ✅
-
លំហូរសញ្ញាទៅសកម្មភាព ៖ ការបញ្ចូលដែលមើលឃើញក្លាយជាលទ្ធផលដែលអាចអនុវត្តបាន។ ផ្ទាំងគ្រប់គ្រងតិចជាង ការសម្រេចចិត្តកាន់តែច្រើន។
-
ការធ្វើឲ្យទូទៅ ៖ ជាមួយនឹងទិន្នន័យត្រឹមត្រូវ ម៉ូដែលមួយអាចដោះស្រាយរូបភាពជាច្រើនប្រភេទ។ មិនបានល្អឥតខ្ចោះទេ ជួនកាលល្អគួរឲ្យភ្ញាក់ផ្អើល។
-
ការប្រើប្រាស់ទិន្នន័យ ៖ កាមេរ៉ាមានតម្លៃថោក និងគ្រប់ទីកន្លែង។ ចក្ខុវិស័យប្រែក្លាយមហាសមុទ្រនៃភីកសែលទៅជាការយល់ដឹង។
-
ល្បឿន ៖ ម៉ូដែលអាចដំណើរការស៊ុមក្នុងពេលវេលាជាក់ស្តែងលើផ្នែករឹងមធ្យម ឬស្ទើរតែពេលវេលាជាក់ស្តែង អាស្រ័យលើភារកិច្ច និងគុណភាពបង្ហាញ។
-
ភាពអាចរៀបចំបាន ៖ ភ្ជាប់ជំហានសាមញ្ញៗទៅជាប្រព័ន្ធដែលអាចទុកចិត្តបាន៖ ការរកឃើញ → ការតាមដាន → ការគ្រប់គ្រងគុណភាព។
-
ប្រព័ន្ធអេកូឡូស៊ី ៖ ឧបករណ៍ ម៉ូដែលដែលបានទទួលការបណ្តុះបណ្តាលជាមុន ស្តង់ដារ និងការគាំទ្រពីសហគមន៍ - ផ្សារកូដដ៏ធំទូលាយមួយ។
ចូរនិយាយដោយស្មោះត្រង់ទៅ រូបមន្តសម្ងាត់មិនមែនជាអាថ៌កំបាំងទេ៖ ទិន្នន័យល្អ ការវាយតម្លៃប្រកបដោយវិន័យ ការដាក់ពង្រាយដោយប្រុងប្រយ័ត្ន។ អ្វីដែលនៅសល់គឺការអនុវត្ត... ហើយប្រហែលជាកាហ្វេ។ ☕
របៀបដែល Computer Vision នៅក្នុង AI ដំណើរការ ក្នុងបំពង់បង្ហូរទិន្នន័យដ៏ត្រឹមត្រូវមួយ 🧪
-
ការចាប់យករូបភាព
កាមេរ៉ា ម៉ាស៊ីនស្កេន យន្តហោះគ្មានមនុស្សបើក ទូរស័ព្ទ។ ជ្រើសរើសប្រភេទឧបករណ៍ចាប់សញ្ញា ការបើកពន្លឺ កែវថត និងអត្រាស៊ុមដោយប្រុងប្រយ័ត្ន។ សំរាមចូលជាដើម។ -
ការកែច្នៃជាមុន ប្តូរ
ទំហំ កាត់ ធ្វើឱ្យមានលក្ខណៈធម្មតា បំបាត់ភាពព្រិល ឬបន្ថយសំឡេងរំខាន ប្រសិនបើចាំបាច់។ ពេលខ្លះការកែសម្រួលកម្រិតពណ៌តិចតួចអាចធ្វើឱ្យរូបភាពផ្លាស់ប្តូរបាន។ [4] -
ស្លាក និងសំណុំទិន្នន័យ
ប្រអប់កំណត់ ពហុកោណ ចំណុចសំខាន់ៗ ចន្លោះអត្ថបទ។ ស្លាកដែលមានតុល្យភាព និងតំណាង ឬគំរូរបស់អ្នករៀនទម្លាប់ដែលមិនស្មើគ្នា។ -
ការធ្វើគំរូ
-
ចំណាត់ថ្នាក់ ៖ "ប្រភេទណា?"
-
ការរកឃើញ ៖ "តើវត្ថុនៅឯណា?"
-
ការបែងចែក ៖ "ភីកសែលណាខ្លះជារបស់អ្វី?"
-
ចំណុចសំខាន់ៗ និងឥរិយាបថ ៖ "តើសន្លាក់ ឬទីតាំងសម្គាល់នៅឯណា?"
-
OCR : “តើអត្ថបទអ្វីដែលមាននៅក្នុងរូបភាព?”
-
ជម្រៅ និង 3D ៖ “តើអ្វីៗទាំងអស់មានចម្ងាយប៉ុន្មាន?”
ស្ថាបត្យកម្មមានភាពខុសប្លែកគ្នា ប៉ុន្តែសំណាញ់ convolutional និងម៉ូដែលរចនាប័ទ្ម transformer លេចធ្លោ។ [1]
-
-
ការហ្វឹកហាត់
បំបែកទិន្នន័យ លៃតម្រូវប៉ារ៉ាម៉ែត្រអ៊ីពែរ ធ្វើឱ្យមានលក្ខណៈធម្មតា បន្ថែម។ ឈប់មុនពេលអ្នកទន្ទេញផ្ទាំងរូបភាព។ -
ការវាយតម្លៃ
ប្រើប្រាស់រង្វាស់ដែលសមស្របនឹងភារកិច្ចដូចជា mAP, IoU, F1, CER/WER សម្រាប់ OCR។ កុំជ្រើសរើសដោយចៃដន្យ។ ប្រៀបធៀបដោយយុត្តិធម៌។ [3] -
ការដាក់ពង្រាយ
សម្រាប់គោលដៅ៖ ការងារជាបាច់លើពពក ការសន្និដ្ឋាននៅលើឧបករណ៍ ម៉ាស៊ីនមេគែម។ ត្រួតពិនិត្យការរសាត់។ បណ្តុះបណ្តាលឡើងវិញនៅពេលដែលពិភពលោកផ្លាស់ប្តូរ។
សំណាញ់ជ្រៅបានជំរុញឱ្យមានជំហានមួយប្រកបដោយគុណភាព នៅពេលដែលសំណុំទិន្នន័យធំៗ និងកុំព្យូទ័របានឈានដល់ម៉ាស់ដ៏សំខាន់។ ស្តង់ដារដូចជាបញ្ហាប្រឈម ImageNet បានធ្វើឱ្យវឌ្ឍនភាពនោះអាចមើលឃើញ និងឥតឈប់ឈរ។ [2]
កិច្ចការស្នូលដែលអ្នកពិតជានឹងប្រើប្រាស់ (និងពេលណា) 🧩
-
ចំណាត់ថ្នាក់រូបភាព ៖ ស្លាកមួយសម្រាប់រូបភាពនីមួយៗ។ ប្រើសម្រាប់តម្រងរហ័ស ការជ្រើសរើស ឬច្រកទ្វារគុណភាព។
-
ការរកឃើញវត្ថុ ៖ ប្រអប់ជុំវិញវត្ថុ។ ការបង្ការការខាតបង់លក់រាយ ការរកឃើញយានយន្ត ការរាប់សត្វព្រៃ។
-
ការបែងចែកឧទាហរណ៍ ៖ រូបភាពស្រមោលដែលមានភាពត្រឹមត្រូវតាមភីកសែលក្នុងមួយវត្ថុ។ ពិការភាពក្នុងការផលិត ឧបករណ៍វះកាត់ បច្ចេកវិទ្យាកសិកម្ម។
-
ការបែងចែកអត្ថន័យ ៖ ថ្នាក់ក្នុងមួយភីកសែលដោយមិនបំបែកឧទាហរណ៍។ ទិដ្ឋភាពផ្លូវថ្នល់ក្នុងទីក្រុង គម្របដី។
-
ការរកឃើញចំណុចសំខាន់ៗ និងឥរិយាបថ ៖ សន្លាក់ ចំណុចសម្គាល់ លក្ខណៈពិសេសលើផ្ទៃមុខ។ ការវិភាគកីឡា សរីរវិទ្យា និង AR។
-
ការតាមដាន ៖ តាមដានវត្ថុតាមពេលវេលា។ ភស្តុភារ ចរាចរណ៍ និងសន្តិសុខ។
-
OCR និងបច្ចេកវិទ្យា AI ឯកសារ ៖ ការស្រង់ចេញអត្ថបទ និងការវិភាគប្លង់។ វិក្កយបត្រ បង្កាន់ដៃ និងទម្រង់បែបបទ។
-
ជម្រៅ និង 3D ៖ ការកសាងឡើងវិញពីទិដ្ឋភាពច្រើន ឬសញ្ញាសម្គាល់ម៉ូណូគូឡា។ មនុស្សយន្ត AR ការគូសផែនទី។
-
ចំណងជើងរងដែលមើលឃើញ ៖ សង្ខេបឈុតឆាកជាភាសាធម្មជាតិ។ ភាពងាយស្រួលចូលដំណើរការ និងការស្វែងរក។
-
គំរូចក្ខុវិស័យ-ភាសា ៖ ហេតុផលពហុម៉ូឌុល ចក្ខុវិស័យបន្ថែមដែលទាញយកមកវិញ ការធានាគុណភាពដែលមានមូលដ្ឋាន។
អារម្មណ៍នៃករណីតូចមួយ៖ នៅក្នុងហាង ឧបករណ៍ចាប់សញ្ញាសម្គាល់ធ្នើរដែលបាត់។ ឧបករណ៍តាមដានការពារការរាប់ទ្វេដងនៅពេលដែលបុគ្គលិកបំពេញស្តុកឡើងវិញ។ ច្បាប់សាមញ្ញមួយនាំស៊ុមដែលមានទំនុកចិត្តទាបទៅការពិនិត្យដោយមនុស្ស។ វាជាវង់ភ្លេងតូចមួយដែលភាគច្រើននៅតែរក្សាបទភ្លេងដដែល។
តារាងប្រៀបធៀប៖ ឧបករណ៍ដើម្បីដឹកជញ្ជូនលឿនជាងមុន 🧰
ចេតនាចម្លែកបន្តិច។ មែនហើយ ចន្លោះគឺចម្លែក - ខ្ញុំដឹង។.
| ឧបករណ៍ / ក្របខ័ណ្ឌ | ល្អបំផុតសម្រាប់ | អាជ្ញាប័ណ្ណ/តម្លៃ | ហេតុអ្វីបានជាវាដំណើរការក្នុងការអនុវត្ត |
|---|---|---|---|
| OpenCV | ការដំណើរការជាមុន, ប្រវត្តិរូបសង្ខេបបែបបុរាណ, សំណួររហ័ស | ឥតគិតថ្លៃ - ប្រភពបើកចំហ | ប្រអប់ឧបករណ៍ដ៏ធំសម្បើម API ដែលមានស្ថេរភាព បានសាកល្បងក្នុងសមរភូមិ; ពេលខ្លះអ្វីគ្រប់យ៉ាងដែលអ្នកត្រូវការ។ [4] |
| PyTorch | ការបណ្តុះបណ្តាលដែលងាយស្រួលសម្រាប់ការស្រាវជ្រាវ | ឥតគិតថ្លៃ | ក្រាហ្វថាមវន្ត ប្រព័ន្ធអេកូឡូស៊ីដ៏ធំ ការបង្រៀនជាច្រើន។. |
| TensorFlow/Keras | ផលិតកម្មក្នុងទ្រង់ទ្រាយធំ | ឥតគិតថ្លៃ | ជម្រើសបម្រើសម្រាប់មនុស្សចាស់ទុំ ល្អសម្រាប់ចល័ត និងគែមផងដែរ។. |
| អ៊ុលត្រាលីទិក យ៉ូឡូ | ការរកឃើញវត្ថុរហ័ស | កម្មវិធីបន្ថែមឥតគិតថ្លៃ + បង់ប្រាក់ | រង្វិលជុំហ្វឹកហាត់ងាយស្រួល ល្បឿន-ភាពត្រឹមត្រូវប្រកួតប្រជែង មានមតិផ្ទាល់ខ្លួន ប៉ុន្តែមានផាសុកភាព។. |
| Detectron2 / ការរកឃើញ MMDetection | មូលដ្ឋានរឹងមាំ ការបែងចែក | ឥតគិតថ្លៃ | ម៉ូដែលថ្នាក់យោងជាមួយនឹងលទ្ធផលដែលអាចបង្កើតឡើងវិញបាន។. |
| ពេលដំណើរការ OpenVINO / ONNX | ការបង្កើនប្រសិទ្ធភាពនៃការសន្និដ្ឋាន | ឥតគិតថ្លៃ | កាត់បន្ថយភាពយឺតយ៉ាវ ដាក់ពង្រាយយ៉ាងទូលំទូលាយដោយមិនចាំបាច់សរសេរឡើងវិញ។. |
| តេសស៊ើរក់ | OCR លើថវិកា | ឥតគិតថ្លៃ | ដំណើរការបានល្អប្រសិនបើអ្នកសម្អាតរូបភាព... ពេលខ្លះអ្នកពិតជាគួរធ្វើដូច្នេះមែន។. |
អ្វីដែលជំរុញគុណភាពនៅក្នុង Computer Vision ក្នុង AI 🔧
-
ការគ្របដណ្តប់ទិន្នន័យ ៖ ការផ្លាស់ប្តូរពន្លឺ មុំ ផ្ទៃខាងក្រោយ ករណីគែម។ ប្រសិនបើវាអាចកើតឡើង សូមរួមបញ្ចូលវា។
-
គុណភាពស្លាក ៖ ប្រអប់មិនស៊ីសង្វាក់គ្នា ឬពហុកោណមិនស្អាតបំផ្លាញ MAP។ ការត្រួតពិនិត្យគុណភាពបន្តិចបន្តួចអាចជួយបានច្រើន។
-
ការបង្កើនប្រសិទ្ធភាពឆ្លាតវៃ ៖ កាត់, បង្វិល, បង្កើនពន្លឺ, បន្ថែមសំឡេងរំខានសំយោគ។ ត្រូវមានភាពប្រាកដនិយម មិនមែនភាពវឹកវរចៃដន្យទេ។
-
ការធ្វើឲ្យសមនឹងការជ្រើសរើសគំរូ ៖ ប្រើការរកឃើញកន្លែងដែលត្រូវការការរកឃើញ - កុំបង្ខំឧបករណ៍ចាត់ថ្នាក់ឲ្យទាយទីតាំង។
-
រង្វាស់ដែលត្រូវនឹងផលប៉ះពាល់ ៖ ប្រសិនបើលទ្ធផលអវិជ្ជមានក្លែងក្លាយធ្វើឱ្យឈឺចាប់ជាង ចូរបង្កើនប្រសិទ្ធភាពនៃការចងចាំ។ ប្រសិនបើលទ្ធផលវិជ្ជមានក្លែងក្លាយធ្វើឱ្យឈឺចាប់ជាង ចូរមានភាពជាក់លាក់ជាមុនសិន។
-
រង្វិលជុំមតិប្រតិកម្មតឹងរ៉ឹង ៖ កត់ត្រាការបរាជ័យ បិទស្លាកឡើងវិញ ហ្វឹកហាត់ឡើងវិញ។ លាងសម្អាត ធ្វើម្តងទៀត។ គួរឱ្យធុញបន្តិច - មានប្រសិទ្ធភាពខ្លាំង។
សម្រាប់ការរកឃើញ/ការបែងចែកផ្នែក ស្តង់ដារសហគមន៍គឺ ភាពជាក់លាក់ជាមធ្យម ដែលគណនាជាមធ្យមនៅទូទាំងកម្រិត IoU - ហៅកាត់ថា mAP រចនាប័ទ្ម COCO ។ ការដឹងពីរបៀបដែល IoU និង AP@{0.5:0.95} ត្រូវបានគណនា ការពារការអះអាងលើតារាងចំណាត់ថ្នាក់ពីការធ្វើឲ្យអ្នកភ្ញាក់ផ្អើលជាមួយនឹងលេខទសភាគ។ [3]
ករណីប្រើប្រាស់ក្នុងពិភពពិតដែលមិនមែនជាសម្មតិកម្ម 🌍
-
លក់រាយ ៖ ការវិភាគធ្នើរ ការបង្ការការខាតបង់ ការត្រួតពិនិត្យជួរ ការអនុលោមតាមផែនការ។
-
ការផលិត ៖ ការរកឃើញពិការភាពលើផ្ទៃ ការផ្ទៀងផ្ទាត់ការផ្គុំ ការណែនាំដោយមនុស្សយន្ត។
-
ការថែទាំសុខភាព ៖ ការជ្រើសរើសប្រភេទវិទ្យុសកម្ម ការរកឃើញឧបករណ៍ ការបែងចែកកោសិកា។
-
ចល័តភាព ៖ ADAS, កាមេរ៉ាចរាចរណ៍, ការកាន់កាប់កន្លែងចតរថយន្ត, ការតាមដានចល័តភាពខ្នាតតូច។
-
កសិកម្ម ៖ ការរាប់ដំណាំ ការរកឃើញជំងឺ ការត្រៀមខ្លួនប្រមូលផល។
-
ការធានារ៉ាប់រង និងហិរញ្ញវត្ថុ ៖ ការវាយតម្លៃការខូចខាត ការត្រួតពិនិត្យ KYC ទង់សម្គាល់ការក្លែងបន្លំ។
-
សំណង់ និងថាមពល ៖ ការអនុលោមតាមសុវត្ថិភាព ការរកឃើញការលេចធ្លាយ ការត្រួតពិនិត្យការច្រេះ។
-
ខ្លឹមសារ និងភាពងាយស្រួលចូលប្រើប្រាស់ ៖ ចំណងជើងរងដោយស្វ័យប្រវត្តិ ការត្រួតពិនិត្យ ការស្វែងរកតាមរូបភាព។
លំនាំដែលអ្នកនឹងសម្គាល់ឃើញ៖ ជំនួសការស្កេនដោយដៃជាមួយនឹងការតម្រៀបដោយស្វ័យប្រវត្តិ បន្ទាប់មកបង្កើនដល់មនុស្សនៅពេលដែលទំនុកចិត្តធ្លាក់ចុះ។ មិនគួរឱ្យទាក់ទាញទេ - ប៉ុន្តែវាធ្វើមាត្រដ្ឋាន។.
ទិន្នន័យ ស្លាក និងរង្វាស់ដែលសំខាន់ 📊
-
ចំណាត់ថ្នាក់ ៖ ភាពត្រឹមត្រូវ, F1 សម្រាប់ភាពមិនស្មើគ្នា។
-
ការរកឃើញ ៖ mAP ឆ្លងកាត់កម្រិត IoU; ត្រួតពិនិត្យ AP ក្នុងមួយថ្នាក់ និងធុងទំហំ។ [3]
-
ការបែងចែក ៖ mIoU, Dice; ពិនិត្យមើលកំហុសកម្រិតឧទាហរណ៍ផងដែរ។
-
ការតាមដាន ៖ MOTA, IDF1; គុណភាពនៃការកំណត់អត្តសញ្ញាណឡើងវិញគឺជាវីរបុរសស្ងាត់ស្ងៀម។
-
OCR : អត្រាកំហុសតួអក្សរ (CER) និងអត្រាកំហុសពាក្យ (WER)។ ការបរាជ័យនៃប្លង់ច្រើនតែកើតមាន។
-
ភារកិច្ចតំរែតំរង់ ៖ ជម្រៅ ឬឥរិយាបថប្រើកំហុសដាច់ខាត/ទាក់ទង (ជាញឹកញាប់លើមាត្រដ្ឋានឡូក)។
សូមកត់ត្រាពិធីការវាយតម្លៃរបស់អ្នក ដើម្បីឱ្យអ្នកដទៃអាចចម្លងវាបាន។ វាមិនសិចស៊ីទេ ប៉ុន្តែវាធ្វើឱ្យអ្នករក្សាភាពស្មោះត្រង់។.
សាងសង់ធៀបនឹងទិញ - និងកន្លែងដែលត្រូវដំណើរការវា 🏗️
-
ពពក ៖ ងាយស្រួលចាប់ផ្តើមបំផុត ល្អសម្រាប់បន្ទុកការងារជាបាច់។ តាមដានថ្លៃដើមចេញ។
-
ឧបករណ៍ Edge ៖ ភាពយឺតយ៉ាវទាបជាង និងភាពឯកជនកាន់តែប្រសើរ។ អ្នកនឹងយកចិត្តទុកដាក់ចំពោះការធ្វើបរិមាណ ការកាត់បន្ថយ និងឧបករណ៍បង្កើនល្បឿន។
-
ទូរស័ព្ទចល័តនៅលើឧបករណ៍ ៖ អស្ចារ្យណាស់នៅពេលដែលវាសម។ ធ្វើឱ្យប្រសើរឡើងនូវម៉ូដែល និងថ្មនាឡិកា។
-
អ៊ីប្រ៊ីដ ៖ តម្រងជាមុននៅគែម ងាយស្រួលសម្អាត។ វាជាការសម្របសម្រួលដ៏ល្អ។
ជង់ដ៏គួរឲ្យធុញទ្រាន់មួយ៖ គំរូដើមជាមួយ PyTorch ហ្វឹកហ្វឺនឧបករណ៍ចាប់សញ្ញាស្តង់ដារ នាំចេញទៅ ONNX បង្កើនល្បឿនជាមួយ OpenVINO/ONNX Runtime និងប្រើ OpenCV សម្រាប់ការដំណើរការជាមុន និងធរណីមាត្រ (ការក្រិតតាមខ្នាត ភាពដូចគ្នា រូបរាង)។ [4]
ហានិភ័យ ក្រមសីលធម៌ និងផ្នែកដែលពិបាកនិយាយអំពី ⚖️
ប្រព័ន្ធចក្ខុវិស័យអាចទទួលមរតកភាពលំអៀងនៃសំណុំទិន្នន័យ ឬចំណុចខ្វាក់ប្រតិបត្តិការ។ ការវាយតម្លៃឯករាជ្យ (ឧទាហរណ៍ NIST FRVT) បានវាស់វែងភាពខុសគ្នានៃប្រជាសាស្ត្រនៅក្នុងអត្រាកំហុសក្នុងការសម្គាល់មុខនៅទូទាំងក្បួនដោះស្រាយ និងលក្ខខណ្ឌ។ នោះមិនមែនជាហេតុផលដែលត្រូវភ័យស្លន់ស្លោនោះទេ ប៉ុន្តែវា ជា ហេតុផលដែលត្រូវសាកល្បងដោយប្រុងប្រយ័ត្ន កត់ត្រាដែនកំណត់ និងតាមដានជាបន្តបន្ទាប់នៅក្នុងផលិតកម្ម។ ប្រសិនបើអ្នកដាក់ពង្រាយករណីប្រើប្រាស់ដែលទាក់ទងនឹងអត្តសញ្ញាណ ឬសុវត្ថិភាព សូមរួមបញ្ចូលការពិនិត្យឡើងវិញដោយមនុស្ស និងយន្តការអំពាវនាវ។ ភាពឯកជន ការយល់ព្រម និងតម្លាភាពមិនមែនជាជម្រើសបន្ថែមទេ។ [5]
ផែនទីបង្ហាញផ្លូវចាប់ផ្តើមរហ័សដែលអ្នកពិតជាអាចអនុវត្តតាមបាន 🗺️
-
កំណត់ការសម្រេចចិត្ត
តើប្រព័ន្ធគួរចាត់វិធានការអ្វីខ្លះបន្ទាប់ពីឃើញរូបភាព? វារារាំងអ្នកពីការធ្វើឱ្យប្រសើរឡើងនូវរង្វាស់ភាពឥតប្រយោជន៍។ -
ប្រមូលសំណុំទិន្នន័យដែលងាយស្រួយ
ចាប់ផ្តើមជាមួយរូបភាពពីរបីរយដែលឆ្លុះបញ្ចាំងពីបរិស្ថានពិតរបស់អ្នក។ ដាក់ស្លាកដោយប្រុងប្រយ័ត្ន - ទោះបីជាអ្នក និងកំណត់ចំណាំបីក៏ដោយ។ -
ជ្រើសរើសគំរូមូលដ្ឋាន
ជ្រើសរើសឆ្អឹងខ្នងសាមញ្ញជាមួយនឹងទម្ងន់ដែលបានហ្វឹកហាត់ជាមុន។ កុំដេញតាមស្ថាបត្យកម្មកម្រនិងអសកម្មនៅឡើយ។ [1] -
ហ្វឹកហាត់ កត់ត្រា វាយតម្លៃ
តាមដានម៉ែត្រ ចំណុចច្រឡំ និងរបៀបបរាជ័យ។ រក្សាសៀវភៅកត់ត្រានៃ "ករណីចម្លែក" - ព្រិល ពន្លឺចាំង ការឆ្លុះបញ្ចាំង ពុម្ពអក្សរចម្លែក។ -
រឹតបន្តឹងរង្វិលជុំ
បន្ថែមសារធាតុអវិជ្ជមានរឹង ជួសជុលភាពរសាត់នៃស្លាក កែតម្រូវការបន្ថែម និងកែសម្រួលកម្រិតកំណត់ឡើងវិញ។ ការកែសម្រួលបន្តិចបន្តួចបន្ថែម។ [3] -
ដាក់ពង្រាយកំណែស្ដើង
វាស់បរិមាណ និងនាំចេញ។ វាស់ស្ទង់ភាពយឺតយ៉ាវ/បរិមាណដំណើរការនៅក្នុងបរិយាកាសពិត មិនមែនជាស្តង់ដារសម្រាប់ប្រដាប់ក្មេងលេងទេ។ -
ត្រួតពិនិត្យ និងធ្វើម្តងទៀត
នូវការប្រមូលកំហុស ស្លាកឡើងវិញ ហ្វឹកហាត់ឡើងវិញ។ កំណត់ពេលវាយតម្លៃតាមកាលកំណត់ ដើម្បីកុំឱ្យគំរូរបស់អ្នកក្លាយជាហ្វូស៊ីល។
គន្លឹះជំនាញ៖ សូមសរសេរចំណារពន្យល់អំពីការទប់ចិត្តតូចមួយដែលបានកំណត់ដោយមិត្តរួមក្រុមដែលមានចរិតសង្ស័យបំផុតរបស់អ្នក។ ប្រសិនបើពួកគេមិនអាចទម្លុះវាបានទេ អ្នកប្រហែលជាត្រៀមខ្លួនរួចរាល់ហើយ។
ចំណុចគួរចៀសវាងទូទៅដែលអ្នកគួរជៀសវាង🧨
-
ការបណ្តុះបណ្តាលលើរូបភាពស្ទូឌីយោស្អាត ការដាក់ពង្រាយទៅក្នុងពិភពពិតជាមួយនឹងភ្លៀងធ្លាក់លើកែវថត។.
-
ការបង្កើនប្រសិទ្ធភាពសម្រាប់ MAP ទាំងមូល នៅពេលដែលអ្នកពិតជាយកចិត្តទុកដាក់ចំពោះថ្នាក់សំខាន់មួយ។ [3]
-
មិនអើពើនឹងភាពមិនស្មើគ្នានៃវណ្ណៈ ហើយបន្ទាប់មកឆ្ងល់ថាហេតុអ្វីបានជាព្រឹត្តិការណ៍កម្រៗបាត់ទៅវិញ។.
-
ការបង្កើនសមត្ថភាពហួសហេតុរហូតដល់គំរូរៀនពីវត្ថុសិប្បនិម្មិត។.
-
រំលងការក្រិតតាមខ្នាតកាមេរ៉ា ហើយបន្ទាប់មកប្រយុទ្ធប្រឆាំងនឹងកំហុសទស្សនវិស័យជារៀងរហូត។ [4]
-
ជឿលើលេខតារាងពិន្ទុដោយមិនចម្លងការរៀបចំការវាយតម្លៃពិតប្រាកដ។ [2][3]
ប្រភពដែលគួរចំណាំ 🔗
ប្រសិនបើអ្នកចូលចិត្តសម្ភារៈបឋម និងកំណត់ចំណាំវគ្គសិក្សា ទាំងនេះគឺជាឯកសារយោងដ៏ល្អសម្រាប់មូលដ្ឋានគ្រឹះ ការអនុវត្ត និងស្តង់ដារ។ សូមមើល ឯកសារយោង សម្រាប់តំណភ្ជាប់៖ កំណត់ចំណាំ CS231n ឯកសារបញ្ហាប្រឈម ImageNet ឯកសារសំណុំទិន្នន័យ/វាយតម្លៃ COCO ឯកសារ OpenCV និងរបាយការណ៍ NIST FRVT។ [1][2][3][4][5]
កំណត់ចំណាំចុងក្រោយ - ឬវែងពេក មិនបានអាន 🍃
ចក្ខុវិស័យកុំព្យូទ័រនៅក្នុង AI ប្រែក្លាយភីកសែលទៅជាការសម្រេចចិត្ត។ វាភ្លឺចែងចាំងនៅពេលអ្នកផ្គូផ្គងភារកិច្ចត្រឹមត្រូវជាមួយនឹងទិន្នន័យត្រឹមត្រូវ វាស់វែងរបស់ត្រឹមត្រូវ និងធ្វើម្តងទៀតជាមួយនឹងវិន័យមិនធម្មតា។ ឧបករណ៍គឺធំទូលាយ ស្តង់ដារគឺជាសាធារណៈ ហើយផ្លូវពីគំរូដើមទៅផលិតកម្មគឺខ្លីគួរឱ្យភ្ញាក់ផ្អើល ប្រសិនបើអ្នកផ្តោតលើការសម្រេចចិត្តចុងក្រោយ។ ធ្វើឱ្យស្លាករបស់អ្នកត្រង់ ជ្រើសរើសម៉ែត្រដែលត្រូវនឹងផលប៉ះពាល់ ហើយអនុញ្ញាតឱ្យគំរូធ្វើការធ្ងន់។ ហើយប្រសិនបើពាក្យប្រៀបធៀបជួយ - សូមគិតអំពីវាដូចជាការបង្រៀនអ្នកហាត់ការដែលលឿនណាស់ ប៉ុន្តែត្រង់ៗ ឱ្យរកឃើញអ្វីដែលសំខាន់។ អ្នកបង្ហាញឧទាហរណ៍ កែកំហុស ហើយទុកចិត្តវាបន្តិចម្តងៗជាមួយនឹងការងារពិតប្រាកដ។ មិនល្អឥតខ្ចោះទេ ប៉ុន្តែជិតគ្រប់គ្រាន់ដើម្បីផ្លាស់ប្តូរ។ 🌟
ឯកសារយោង
-
CS231n៖ ការរៀនសូត្រស៊ីជម្រៅសម្រាប់ចក្ខុវិស័យកុំព្យូទ័រ (កំណត់ចំណាំវគ្គសិក្សា) - សាកលវិទ្យាល័យស្ទែនហ្វដ។
អានបន្ថែម -
ការប្រកួតប្រជែងទទួលស្គាល់រូបភាពទ្រង់ទ្រាយធំរបស់ ImageNet (ឯកសារ) - Russakovsky et al.
អានបន្ថែម -
សំណុំទិន្នន័យ និងការវាយតម្លៃ COCO - គេហទំព័រផ្លូវការ (និយមន័យភារកិច្ច និងអនុសញ្ញា mAP/IoU)។
អានបន្ថែម -
ឯកសារ OpenCV (v4.x) - ម៉ូឌុលសម្រាប់ដំណើរការជាមុន ការក្រិតតាមខ្នាត រូបរាងវិទ្យា។ល។
អានបន្ថែម -
NIST FRVT ផ្នែកទី 3៖ ផលប៉ះពាល់ប្រជាសាស្ត្រ (NISTIR 8280) - ការវាយតម្លៃឯករាជ្យនៃភាពត្រឹមត្រូវនៃការសម្គាល់មុខនៅទូទាំងប្រជាសាស្ត្រ។
អានបន្ថែម