តើចក្ខុវិស័យកុំព្យូទ័រនៅក្នុង AI ជាអ្វី?

តើ​ចក្ខុវិស័យ​កុំព្យូទ័រ​ក្នុង​ AI ជា​អ្វី?

ប្រសិនបើអ្នកធ្លាប់ដោះសោទូរស័ព្ទរបស់អ្នកដោយប្រើមុខរបស់អ្នក ស្កេនបង្កាន់ដៃ ឬសម្លឹងមើលកាមេរ៉ាទូទាត់ប្រាក់ដោយខ្លួនឯងដោយឆ្ងល់ថាតើវាកំពុងវិនិច្ឆ័យផ្លែបឺររបស់អ្នកឬអត់ អ្នកបានប្រឆាំងនឹងចក្ខុវិស័យកុំព្យូទ័រហើយ។ និយាយឱ្យសាមញ្ញទៅ ចក្ខុវិស័យកុំព្យូទ័រនៅក្នុង AI គឺជារបៀបដែលម៉ាស៊ីនរៀន មើលឃើញ និង យល់ រូបភាព និងវីដេអូបានល្អគ្រប់គ្រាន់ដើម្បីធ្វើការសម្រេចចិត្ត។ មានប្រយោជន៍? ពិតជាមានមែន។ ពេលខ្លះគួរឱ្យភ្ញាក់ផ្អើល? មែនហើយដែរ។ ហើយពេលខ្លះគួរឱ្យខ្លាចបន្តិចប្រសិនបើយើងនិយាយដោយស្មោះត្រង់។ ក្នុងករណីល្អបំផុត វាប្រែក្លាយភីកសែលរញ៉េរញ៉ៃទៅជាសកម្មភាពជាក់ស្តែង។ ក្នុងករណីអាក្រក់បំផុត វាទាយ និងរង្គើ។ ចូរយើងស្វែងយល់ឱ្យបានត្រឹមត្រូវ។

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 តើភាពលំអៀងនៃ AI ជាអ្វី?
របៀបដែលភាពលំអៀងកើតឡើងនៅក្នុងប្រព័ន្ធ AI និងវិធីដើម្បីរកឃើញ និងកាត់បន្ថយវា។

🔗 តើ AI ព្យាករណ៍ជាអ្វី?
របៀបដែល AI ព្យាករណ៍ប្រើប្រាស់ទិន្នន័យដើម្បីព្យាករណ៍និន្នាការ និងលទ្ធផល។

🔗 តើគ្រូបង្វឹក AI ជាអ្វី?
ទំនួលខុសត្រូវ ជំនាញ និងឧបករណ៍ដែលប្រើប្រាស់ដោយអ្នកជំនាញដែលបណ្តុះបណ្តាល AI។

🔗 តើ Google Vertex AI ជាអ្វី?
ទិដ្ឋភាពទូទៅនៃវេទិកា AI បង្រួបបង្រួមរបស់ Google សម្រាប់ការបង្កើត និងដាក់ពង្រាយគំរូ។


តើ​ចក្ខុវិស័យ​កុំព្យូទ័រ​ក្នុង​បញ្ញា​សិប្បនិម្មិត (AI) ជា​អ្វី​ឲ្យ​ប្រាកដ? 📸

ចក្ខុវិស័យកុំព្យូទ័រនៅក្នុង AI គឺជាសាខានៃបញ្ញាសិប្បនិម្មិតដែលបង្រៀនកុំព្យូទ័រឱ្យបកស្រាយ និងវែកញែកអំពីទិន្នន័យដែលមើលឃើញ។ វាគឺជាបំពង់បង្ហូរពីភីកសែលឆៅទៅជាអត្ថន័យដែលមានរចនាសម្ព័ន្ធ៖ "នេះជាសញ្ញាឈប់" "អ្នកទាំងនោះជាអ្នកថ្មើរជើង" "ការផ្សារមានបញ្ហា" "ចំនួនសរុបវិក្កយបត្រនៅទីនេះ"។ វាគ្របដណ្តប់លើភារកិច្ចដូចជាការចាត់ថ្នាក់ ការរកឃើញ ការបែងចែក ការតាមដាន ការប៉ាន់ស្មានជម្រៅ OCR និងច្រើនទៀតដែលដេរភ្ជាប់គ្នាដោយគំរូរៀនលំនាំ។ វិស័យផ្លូវការគ្របដណ្តប់លើធរណីមាត្របុរាណរហូតដល់ការរៀនស៊ីជម្រៅទំនើប ជាមួយនឹងសៀវភៅណែនាំជាក់ស្តែងដែលអ្នកអាចចម្លង និងកែសម្រួលបាន។ [1]

រឿងខ្លីមួយ៖ ស្រមៃមើលខ្សែសង្វាក់វេចខ្ចប់មួយដែលមានកាមេរ៉ាកម្រិត 720p តូចមួយ។ ឧបករណ៍ចាប់សញ្ញាទម្ងន់ស្រាលមួយអាចរកឃើញសញ្ញាសម្គាល់ ហើយឧបករណ៍តាមដានសាមញ្ញមួយបញ្ជាក់ថាពួកវាត្រូវបានតម្រឹមគ្នាសម្រាប់ស៊ុមប្រាំជាប់ៗគ្នា មុនពេលបើកភ្លើងខៀវសម្រាប់ដប។ មិនទំនើបទេ ប៉ុន្តែថោក លឿន និងកាត់បន្ថយការងារឡើងវិញ។


តើ​អ្វី​ទៅ​ដែល​ធ្វើ​ឱ្យ​ចក្ខុវិស័យ​កុំព្យូទ័រ​ក្នុង​ AI មាន​ប្រយោជន៍? ✅

  • លំហូរសញ្ញាទៅសកម្មភាព ៖ ការបញ្ចូលដែលមើលឃើញក្លាយជាលទ្ធផលដែលអាចអនុវត្តបាន។ ផ្ទាំងគ្រប់គ្រងតិចជាង ការសម្រេចចិត្តកាន់តែច្រើន។

  • ការធ្វើ​ឲ្យ​ទូទៅ ៖ ជាមួយ​នឹង​ទិន្នន័យ​ត្រឹមត្រូវ ម៉ូដែល​មួយ​អាច​ដោះស្រាយ​រូបភាព​ជាច្រើន​ប្រភេទ។ មិន​បាន​ល្អឥតខ្ចោះ​ទេ ជួនកាល​ល្អ​គួរ​ឲ្យ​ភ្ញាក់ផ្អើល។

  • ការប្រើប្រាស់ទិន្នន័យ ៖ កាមេរ៉ាមានតម្លៃថោក និងគ្រប់ទីកន្លែង។ ចក្ខុវិស័យប្រែក្លាយមហាសមុទ្រនៃភីកសែលទៅជាការយល់ដឹង។

  • ល្បឿន ៖ ម៉ូដែលអាចដំណើរការស៊ុមក្នុងពេលវេលាជាក់ស្តែងលើផ្នែករឹងមធ្យម ឬស្ទើរតែពេលវេលាជាក់ស្តែង អាស្រ័យលើភារកិច្ច និងគុណភាពបង្ហាញ។

  • ភាពអាចរៀបចំបាន ៖ ភ្ជាប់ជំហានសាមញ្ញៗទៅជាប្រព័ន្ធដែលអាចទុកចិត្តបាន៖ ការរកឃើញ → ការតាមដាន → ការគ្រប់គ្រងគុណភាព។

  • ប្រព័ន្ធអេកូឡូស៊ី ៖ ឧបករណ៍ ម៉ូដែលដែលបានទទួលការបណ្តុះបណ្តាលជាមុន ស្តង់ដារ និងការគាំទ្រពីសហគមន៍ - ផ្សារកូដដ៏ធំទូលាយមួយ។

ចូរនិយាយដោយស្មោះត្រង់ទៅ រូបមន្តសម្ងាត់មិនមែនជាអាថ៌កំបាំងទេ៖ ទិន្នន័យល្អ ការវាយតម្លៃប្រកបដោយវិន័យ ការដាក់ពង្រាយដោយប្រុងប្រយ័ត្ន។ អ្វីដែលនៅសល់គឺការអនុវត្ត... ហើយប្រហែលជាកាហ្វេ។ ☕


របៀបដែល Computer Vision នៅក្នុង AI ដំណើរការ ក្នុងបំពង់បង្ហូរទិន្នន័យដ៏ត្រឹមត្រូវមួយ 🧪

  1. ការចាប់យករូបភាព
    កាមេរ៉ា ម៉ាស៊ីនស្កេន យន្តហោះគ្មានមនុស្សបើក ទូរស័ព្ទ។ ជ្រើសរើសប្រភេទឧបករណ៍ចាប់សញ្ញា ការបើកពន្លឺ កែវថត និងអត្រាស៊ុមដោយប្រុងប្រយ័ត្ន។ សំរាមចូលជាដើម។

  2. ការកែច្នៃជាមុន ប្តូរ
    ទំហំ កាត់ ធ្វើឱ្យមានលក្ខណៈធម្មតា បំបាត់ភាពព្រិល ឬបន្ថយសំឡេងរំខាន ប្រសិនបើចាំបាច់។ ពេលខ្លះការកែសម្រួលកម្រិតពណ៌តិចតួចអាចធ្វើឱ្យរូបភាពផ្លាស់ប្តូរបាន។ [4]

  3. ស្លាក និងសំណុំទិន្នន័យ
    ប្រអប់កំណត់ ពហុកោណ ចំណុចសំខាន់ៗ ចន្លោះអត្ថបទ។ ស្លាកដែលមានតុល្យភាព និងតំណាង ឬគំរូរបស់អ្នករៀនទម្លាប់ដែលមិនស្មើគ្នា។

  4. ការធ្វើគំរូ

    • ចំណាត់ថ្នាក់ ៖ "ប្រភេទណា?"

    • ការរកឃើញ ៖ "តើវត្ថុនៅឯណា?"

    • ការបែងចែក ៖ "ភីកសែលណាខ្លះជារបស់អ្វី?"

    • ចំណុចសំខាន់ៗ និងឥរិយាបថ ៖ "តើសន្លាក់ ឬទីតាំងសម្គាល់នៅឯណា?"

    • OCR : “តើ​អត្ថបទ​អ្វី​ដែល​មាន​នៅ​ក្នុង​រូបភាព?”

    • ជម្រៅ និង 3D ៖ “តើអ្វីៗទាំងអស់មានចម្ងាយប៉ុន្មាន?”
      ស្ថាបត្យកម្មមានភាពខុសប្លែកគ្នា ប៉ុន្តែសំណាញ់ convolutional និងម៉ូដែលរចនាប័ទ្ម transformer លេចធ្លោ។ [1]

  5. ការហ្វឹកហាត់
    បំបែកទិន្នន័យ លៃតម្រូវប៉ារ៉ាម៉ែត្រអ៊ីពែរ ធ្វើឱ្យមានលក្ខណៈធម្មតា បន្ថែម។ ឈប់មុនពេលអ្នកទន្ទេញផ្ទាំងរូបភាព។

  6. ការវាយតម្លៃ
    ប្រើប្រាស់រង្វាស់ដែលសមស្របនឹងភារកិច្ចដូចជា mAP, IoU, F1, CER/WER សម្រាប់ OCR។ កុំជ្រើសរើសដោយចៃដន្យ។ ប្រៀបធៀបដោយយុត្តិធម៌។ [3]

  7. ការដាក់ពង្រាយ
    សម្រាប់គោលដៅ៖ ការងារជាបាច់លើពពក ការសន្និដ្ឋាននៅលើឧបករណ៍ ម៉ាស៊ីនមេគែម។ ត្រួតពិនិត្យការរសាត់។ បណ្តុះបណ្តាលឡើងវិញនៅពេលដែលពិភពលោកផ្លាស់ប្តូរ។

សំណាញ់ជ្រៅបានជំរុញឱ្យមានជំហានមួយប្រកបដោយគុណភាព នៅពេលដែលសំណុំទិន្នន័យធំៗ និងកុំព្យូទ័របានឈានដល់ម៉ាស់ដ៏សំខាន់។ ស្តង់ដារដូចជាបញ្ហាប្រឈម ImageNet បានធ្វើឱ្យវឌ្ឍនភាពនោះអាចមើលឃើញ និងឥតឈប់ឈរ។ [2]


កិច្ចការស្នូលដែលអ្នកពិតជានឹងប្រើប្រាស់ (និងពេលណា) 🧩

  • ចំណាត់ថ្នាក់រូបភាព ៖ ស្លាកមួយសម្រាប់រូបភាពនីមួយៗ។ ប្រើសម្រាប់តម្រងរហ័ស ការជ្រើសរើស ឬច្រកទ្វារគុណភាព។

  • ការរកឃើញវត្ថុ ៖ ប្រអប់ជុំវិញវត្ថុ។ ការបង្ការការខាតបង់លក់រាយ ការរកឃើញយានយន្ត ការរាប់សត្វព្រៃ។

  • ការបែងចែកឧទាហរណ៍ ៖ រូបភាពស្រមោលដែលមានភាពត្រឹមត្រូវតាមភីកសែលក្នុងមួយវត្ថុ។ ពិការភាពក្នុងការផលិត ឧបករណ៍វះកាត់ បច្ចេកវិទ្យាកសិកម្ម។

  • ការបែងចែកអត្ថន័យ ៖ ថ្នាក់ក្នុងមួយភីកសែលដោយមិនបំបែកឧទាហរណ៍។ ទិដ្ឋភាពផ្លូវថ្នល់ក្នុងទីក្រុង គម្របដី។

  • ការរកឃើញចំណុចសំខាន់ៗ និងឥរិយាបថ ៖ សន្លាក់ ចំណុចសម្គាល់ លក្ខណៈពិសេសលើផ្ទៃមុខ។ ការវិភាគកីឡា សរីរវិទ្យា និង AR។

  • ការតាមដាន ៖ តាមដានវត្ថុតាមពេលវេលា។ ភស្តុភារ ចរាចរណ៍ និងសន្តិសុខ។

  • OCR និង​បច្ចេកវិទ្យា AI ឯកសារ ៖ ការស្រង់ចេញ​អត្ថបទ និង​ការវិភាគ​ប្លង់។ វិក្កយបត្រ បង្កាន់ដៃ និង​ទម្រង់បែបបទ។

  • ជម្រៅ និង 3D ៖ ការកសាងឡើងវិញពីទិដ្ឋភាពច្រើន ឬសញ្ញាសម្គាល់ម៉ូណូគូឡា។ មនុស្សយន្ត AR ការគូសផែនទី។

  • ចំណងជើងរងដែលមើលឃើញ ៖ សង្ខេបឈុតឆាកជាភាសាធម្មជាតិ។ ភាពងាយស្រួលចូលដំណើរការ និងការស្វែងរក។

  • គំរូចក្ខុវិស័យ-ភាសា ៖ ហេតុផលពហុម៉ូឌុល ចក្ខុវិស័យបន្ថែមដែលទាញយកមកវិញ ការធានាគុណភាពដែលមានមូលដ្ឋាន។

អារម្មណ៍​នៃ​ករណី​តូច​មួយ៖ នៅ​ក្នុង​ហាង ឧបករណ៍​ចាប់​សញ្ញា​សម្គាល់​ធ្នើរ​ដែល​បាត់។ ឧបករណ៍​តាមដាន​ការពារ​ការ​រាប់​ទ្វេដង​នៅ​ពេល​ដែល​បុគ្គលិក​បំពេញ​ស្តុក​ឡើងវិញ។ ច្បាប់​សាមញ្ញ​មួយ​នាំ​ស៊ុម​ដែល​មាន​ទំនុក​ចិត្ត​ទាប​ទៅ​ការ​ពិនិត្យ​ដោយ​មនុស្ស។ វា​ជា​វង់ភ្លេង​តូច​មួយ​ដែល​ភាគ​ច្រើន​នៅ​តែ​រក្សា​បទ​ភ្លេង​ដដែល។


តារាងប្រៀបធៀប៖ ឧបករណ៍ដើម្បីដឹកជញ្ជូនលឿនជាងមុន 🧰

ចេតនា​ចម្លែក​បន្តិច។ មែនហើយ ចន្លោះ​គឺ​ចម្លែក - ខ្ញុំ​ដឹង។.

ឧបករណ៍ / ក្របខ័ណ្ឌ ល្អបំផុតសម្រាប់ អាជ្ញាប័ណ្ណ/តម្លៃ ហេតុអ្វីបានជាវាដំណើរការក្នុងការអនុវត្ត
OpenCV ការដំណើរការជាមុន, ប្រវត្តិរូបសង្ខេបបែបបុរាណ, សំណួររហ័ស ឥតគិតថ្លៃ - ប្រភពបើកចំហ ប្រអប់ឧបករណ៍ដ៏ធំសម្បើម API ដែលមានស្ថេរភាព បានសាកល្បងក្នុងសមរភូមិ; ពេលខ្លះអ្វីគ្រប់យ៉ាងដែលអ្នកត្រូវការ។ [4]
PyTorch ការបណ្តុះបណ្តាលដែលងាយស្រួលសម្រាប់ការស្រាវជ្រាវ ឥតគិតថ្លៃ ក្រាហ្វថាមវន្ត ប្រព័ន្ធអេកូឡូស៊ីដ៏ធំ ការបង្រៀនជាច្រើន។.
TensorFlow/Keras ផលិតកម្មក្នុងទ្រង់ទ្រាយធំ ឥតគិតថ្លៃ ជម្រើសបម្រើសម្រាប់មនុស្សចាស់ទុំ ល្អសម្រាប់ចល័ត និងគែមផងដែរ។.
អ៊ុលត្រាលីទិក យ៉ូឡូ ការរកឃើញវត្ថុរហ័ស កម្មវិធីបន្ថែមឥតគិតថ្លៃ + បង់ប្រាក់ រង្វិលជុំហ្វឹកហាត់ងាយស្រួល ល្បឿន-ភាពត្រឹមត្រូវប្រកួតប្រជែង មានមតិផ្ទាល់ខ្លួន ប៉ុន្តែមានផាសុកភាព។.
Detectron2 / ការរកឃើញ MMDetection មូលដ្ឋានរឹងមាំ ការបែងចែក ឥតគិតថ្លៃ ម៉ូដែលថ្នាក់យោងជាមួយនឹងលទ្ធផលដែលអាចបង្កើតឡើងវិញបាន។.
ពេលដំណើរការ OpenVINO / ONNX ការបង្កើនប្រសិទ្ធភាពនៃការសន្និដ្ឋាន ឥតគិតថ្លៃ កាត់បន្ថយភាពយឺតយ៉ាវ ដាក់ពង្រាយយ៉ាងទូលំទូលាយដោយមិនចាំបាច់សរសេរឡើងវិញ។.
តេសស៊ើរក់ OCR លើថវិកា ឥតគិតថ្លៃ ដំណើរការ​បាន​ល្អ​ប្រសិន​បើ​អ្នក​សម្អាត​រូបភាព... ពេលខ្លះ​អ្នក​ពិតជា​គួរ​ធ្វើ​ដូច្នេះ​មែន។.

អ្វីដែលជំរុញគុណភាពនៅក្នុង Computer Vision ក្នុង AI 🔧

  • ការគ្របដណ្តប់ទិន្នន័យ ៖ ការផ្លាស់ប្តូរពន្លឺ មុំ ផ្ទៃខាងក្រោយ ករណីគែម។ ប្រសិនបើវាអាចកើតឡើង សូមរួមបញ្ចូលវា។

  • គុណភាពស្លាក ៖ ប្រអប់មិនស៊ីសង្វាក់គ្នា ឬពហុកោណមិនស្អាតបំផ្លាញ MAP។ ការត្រួតពិនិត្យគុណភាពបន្តិចបន្តួចអាចជួយបានច្រើន។

  • ការបង្កើនប្រសិទ្ធភាពឆ្លាតវៃ ៖ កាត់, បង្វិល, បង្កើនពន្លឺ, បន្ថែមសំឡេងរំខានសំយោគ។ ត្រូវមានភាពប្រាកដនិយម មិនមែនភាពវឹកវរចៃដន្យទេ។

  • ការ​ធ្វើ​ឲ្យ​សម​នឹង​ការ​ជ្រើសរើស​គំរូ ៖ ប្រើ​ការ​រក​ឃើញ​កន្លែង​ដែល​ត្រូវការ​ការ​រក​ឃើញ - កុំ​បង្ខំ​ឧបករណ៍​ចាត់ថ្នាក់​ឲ្យ​ទាយ​ទីតាំង។

  • រង្វាស់ដែលត្រូវនឹងផលប៉ះពាល់ ៖ ប្រសិនបើលទ្ធផលអវិជ្ជមានក្លែងក្លាយធ្វើឱ្យឈឺចាប់ជាង ចូរបង្កើនប្រសិទ្ធភាពនៃការចងចាំ។ ប្រសិនបើលទ្ធផលវិជ្ជមានក្លែងក្លាយធ្វើឱ្យឈឺចាប់ជាង ចូរមានភាពជាក់លាក់ជាមុនសិន។

  • រង្វិលជុំមតិប្រតិកម្មតឹងរ៉ឹង ៖ កត់ត្រាការបរាជ័យ បិទស្លាកឡើងវិញ ហ្វឹកហាត់ឡើងវិញ។ លាងសម្អាត ធ្វើម្តងទៀត។ គួរឱ្យធុញបន្តិច - មានប្រសិទ្ធភាពខ្លាំង។

សម្រាប់ការរកឃើញ/ការបែងចែកផ្នែក ស្តង់ដារសហគមន៍គឺ ភាពជាក់លាក់ជាមធ្យម ដែលគណនាជាមធ្យមនៅទូទាំងកម្រិត IoU - ហៅកាត់ថា mAP រចនាប័ទ្ម COCO ។ ការដឹងពីរបៀបដែល IoU និង AP@{0.5:0.95} ត្រូវបានគណនា ការពារការអះអាងលើតារាងចំណាត់ថ្នាក់ពីការធ្វើឲ្យអ្នកភ្ញាក់ផ្អើលជាមួយនឹងលេខទសភាគ។ [3]


ករណីប្រើប្រាស់ក្នុងពិភពពិតដែលមិនមែនជាសម្មតិកម្ម 🌍

  • លក់រាយ ៖ ការវិភាគធ្នើរ ការបង្ការការខាតបង់ ការត្រួតពិនិត្យជួរ ការអនុលោមតាមផែនការ។

  • ការផលិត ៖ ការរកឃើញពិការភាពលើផ្ទៃ ការផ្ទៀងផ្ទាត់ការផ្គុំ ការណែនាំដោយមនុស្សយន្ត។

  • ការថែទាំសុខភាព ៖ ការជ្រើសរើសប្រភេទវិទ្យុសកម្ម ការរកឃើញឧបករណ៍ ការបែងចែកកោសិកា។

  • ចល័តភាព ៖ ADAS, កាមេរ៉ាចរាចរណ៍, ការកាន់កាប់កន្លែងចតរថយន្ត, ការតាមដានចល័តភាពខ្នាតតូច។

  • កសិកម្ម ៖ ការរាប់ដំណាំ ការរកឃើញជំងឺ ការត្រៀមខ្លួនប្រមូលផល។

  • ការធានារ៉ាប់រង និងហិរញ្ញវត្ថុ ៖ ការវាយតម្លៃការខូចខាត ការត្រួតពិនិត្យ KYC ទង់សម្គាល់ការក្លែងបន្លំ។

  • សំណង់ និងថាមពល ៖ ការអនុលោមតាមសុវត្ថិភាព ការរកឃើញការលេចធ្លាយ ការត្រួតពិនិត្យការច្រេះ។

  • ខ្លឹមសារ និងភាពងាយស្រួលចូលប្រើប្រាស់ ៖ ចំណងជើងរងដោយស្វ័យប្រវត្តិ ការត្រួតពិនិត្យ ការស្វែងរកតាមរូបភាព។

លំនាំដែលអ្នកនឹងសម្គាល់ឃើញ៖ ជំនួសការស្កេនដោយដៃជាមួយនឹងការតម្រៀបដោយស្វ័យប្រវត្តិ បន្ទាប់មកបង្កើនដល់មនុស្សនៅពេលដែលទំនុកចិត្តធ្លាក់ចុះ។ មិនគួរឱ្យទាក់ទាញទេ - ប៉ុន្តែវាធ្វើមាត្រដ្ឋាន។.


ទិន្នន័យ ស្លាក និងរង្វាស់ដែលសំខាន់ 📊

  • ចំណាត់ថ្នាក់ ៖ ភាពត្រឹមត្រូវ, F1 សម្រាប់ភាពមិនស្មើគ្នា។

  • ការរកឃើញ ៖ mAP ឆ្លងកាត់កម្រិត IoU; ត្រួតពិនិត្យ AP ក្នុងមួយថ្នាក់ និងធុងទំហំ។ [3]

  • ការបែងចែក ៖ mIoU, Dice; ពិនិត្យមើលកំហុសកម្រិតឧទាហរណ៍ផងដែរ។

  • ការតាមដាន ៖ MOTA, IDF1; គុណភាពនៃការកំណត់អត្តសញ្ញាណឡើងវិញគឺជាវីរបុរសស្ងាត់ស្ងៀម។

  • OCR : អត្រាកំហុសតួអក្សរ (CER) និងអត្រាកំហុសពាក្យ (WER)។ ការបរាជ័យនៃប្លង់ច្រើនតែកើតមាន។

  • ភារកិច្ច​តំរែតំរង់ ៖ ជម្រៅ ឬ​ឥរិយាបថ​ប្រើ​កំហុស​ដាច់ខាត/ទាក់ទង (ជាញឹកញាប់​លើ​មាត្រដ្ឋាន​ឡូក)។

សូមកត់ត្រាពិធីការវាយតម្លៃរបស់អ្នក ដើម្បីឱ្យអ្នកដទៃអាចចម្លងវាបាន។ វាមិនសិចស៊ីទេ ប៉ុន្តែវាធ្វើឱ្យអ្នករក្សាភាពស្មោះត្រង់។.


សាងសង់ធៀបនឹងទិញ - និងកន្លែងដែលត្រូវដំណើរការវា 🏗️

  • ពពក ៖ ងាយស្រួលចាប់ផ្តើមបំផុត ល្អសម្រាប់បន្ទុកការងារជាបាច់។ តាមដានថ្លៃដើមចេញ។

  • ឧបករណ៍ Edge ៖ ភាពយឺតយ៉ាវទាបជាង និងភាពឯកជនកាន់តែប្រសើរ។ អ្នកនឹងយកចិត្តទុកដាក់ចំពោះការធ្វើបរិមាណ ការកាត់បន្ថយ និងឧបករណ៍បង្កើនល្បឿន។

  • ទូរស័ព្ទចល័តនៅលើឧបករណ៍ ៖ អស្ចារ្យណាស់នៅពេលដែលវាសម។ ធ្វើឱ្យប្រសើរឡើងនូវម៉ូដែល និងថ្មនាឡិកា។

  • អ៊ីប្រ៊ីដ ៖ តម្រងជាមុននៅគែម ងាយស្រួលសម្អាត។ វាជាការសម្របសម្រួលដ៏ល្អ។

ជង់​ដ៏​គួរ​ឲ្យ​ធុញ​ទ្រាន់​មួយ៖ គំរូ​ដើម​ជាមួយ PyTorch ហ្វឹកហ្វឺន​ឧបករណ៍​ចាប់​សញ្ញា​ស្តង់ដារ នាំចេញ​ទៅ ONNX បង្កើនល្បឿន​ជាមួយ OpenVINO/ONNX Runtime និង​ប្រើ OpenCV សម្រាប់​ការ​ដំណើរការ​ជាមុន និង​ធរណីមាត្រ (ការ​ក្រិត​តាម​ខ្នាត ភាព​ដូចគ្នា រូបរាង)។ [4]


ហានិភ័យ ក្រមសីលធម៌ និងផ្នែកដែលពិបាកនិយាយអំពី ⚖️

ប្រព័ន្ធចក្ខុវិស័យអាចទទួលមរតកភាពលំអៀងនៃសំណុំទិន្នន័យ ឬចំណុចខ្វាក់ប្រតិបត្តិការ។ ការវាយតម្លៃឯករាជ្យ (ឧទាហរណ៍ NIST FRVT) បានវាស់វែងភាពខុសគ្នានៃប្រជាសាស្ត្រនៅក្នុងអត្រាកំហុសក្នុងការសម្គាល់មុខនៅទូទាំងក្បួនដោះស្រាយ និងលក្ខខណ្ឌ។ នោះមិនមែនជាហេតុផលដែលត្រូវភ័យស្លន់ស្លោនោះទេ ប៉ុន្តែវា ជា ហេតុផលដែលត្រូវសាកល្បងដោយប្រុងប្រយ័ត្ន កត់ត្រាដែនកំណត់ និងតាមដានជាបន្តបន្ទាប់នៅក្នុងផលិតកម្ម។ ប្រសិនបើអ្នកដាក់ពង្រាយករណីប្រើប្រាស់ដែលទាក់ទងនឹងអត្តសញ្ញាណ ឬសុវត្ថិភាព សូមរួមបញ្ចូលការពិនិត្យឡើងវិញដោយមនុស្ស និងយន្តការអំពាវនាវ។ ភាពឯកជន ការយល់ព្រម និងតម្លាភាពមិនមែនជាជម្រើសបន្ថែមទេ។ [5]


ផែនទីបង្ហាញផ្លូវចាប់ផ្តើមរហ័សដែលអ្នកពិតជាអាចអនុវត្តតាមបាន 🗺️

  1. កំណត់ការសម្រេចចិត្ត
    តើប្រព័ន្ធគួរចាត់វិធានការអ្វីខ្លះបន្ទាប់ពីឃើញរូបភាព? វារារាំងអ្នកពីការធ្វើឱ្យប្រសើរឡើងនូវរង្វាស់ភាពឥតប្រយោជន៍។

  2. ប្រមូលសំណុំទិន្នន័យដែលងាយស្រួយ
    ចាប់ផ្តើមជាមួយរូបភាពពីរបីរយដែលឆ្លុះបញ្ចាំងពីបរិស្ថានពិតរបស់អ្នក។ ដាក់ស្លាកដោយប្រុងប្រយ័ត្ន - ទោះបីជាអ្នក និងកំណត់ចំណាំបីក៏ដោយ។

  3. ជ្រើសរើសគំរូមូលដ្ឋាន
    ជ្រើសរើសឆ្អឹងខ្នងសាមញ្ញជាមួយនឹងទម្ងន់ដែលបានហ្វឹកហាត់ជាមុន។ កុំដេញតាមស្ថាបត្យកម្មកម្រនិងអសកម្មនៅឡើយ។ [1]

  4. ហ្វឹកហាត់ កត់ត្រា វាយតម្លៃ
    តាមដានម៉ែត្រ ចំណុចច្រឡំ និងរបៀបបរាជ័យ។ រក្សាសៀវភៅកត់ត្រានៃ "ករណីចម្លែក" - ព្រិល ពន្លឺចាំង ការឆ្លុះបញ្ចាំង ពុម្ពអក្សរចម្លែក។

  5. រឹតបន្តឹងរង្វិលជុំ
    បន្ថែមសារធាតុអវិជ្ជមានរឹង ជួសជុលភាពរសាត់នៃស្លាក កែតម្រូវការបន្ថែម និងកែសម្រួលកម្រិតកំណត់ឡើងវិញ។ ការកែសម្រួលបន្តិចបន្តួចបន្ថែម។ [3]

  6. ដាក់ពង្រាយកំណែស្ដើង
    វាស់បរិមាណ និងនាំចេញ។ វាស់ស្ទង់ភាពយឺតយ៉ាវ/បរិមាណដំណើរការនៅក្នុងបរិយាកាសពិត មិនមែនជាស្តង់ដារសម្រាប់ប្រដាប់ក្មេងលេងទេ។

  7. ត្រួតពិនិត្យ និងធ្វើម្តងទៀត
    នូវការប្រមូលកំហុស ស្លាកឡើងវិញ ហ្វឹកហាត់ឡើងវិញ។ កំណត់ពេលវាយតម្លៃតាមកាលកំណត់ ដើម្បីកុំឱ្យគំរូរបស់អ្នកក្លាយជាហ្វូស៊ីល។

គន្លឹះ​ជំនាញ៖ សូម​សរសេរ​ចំណារ​ពន្យល់​អំពី​ការ​ទប់​ចិត្ត​តូច​មួយ​ដែល​បាន​កំណត់​ដោយ​មិត្ត​រួម​ក្រុម​ដែល​មាន​ចរិត​សង្ស័យ​បំផុត​របស់​អ្នក។ ប្រសិនបើ​ពួកគេ​មិន​អាច​ទម្លុះ​វា​បាន​ទេ អ្នក​ប្រហែល​ជា​ត្រៀម​ខ្លួន​រួចរាល់​ហើយ។


ចំណុច​គួរ​ចៀសវាង​ទូទៅ​ដែល​អ្នក​គួរ​ជៀសវាង​🧨

  • ការបណ្តុះបណ្តាលលើរូបភាពស្ទូឌីយោស្អាត ការដាក់ពង្រាយទៅក្នុងពិភពពិតជាមួយនឹងភ្លៀងធ្លាក់លើកែវថត។.

  • ការបង្កើនប្រសិទ្ធភាពសម្រាប់ MAP ទាំងមូល នៅពេលដែលអ្នកពិតជាយកចិត្តទុកដាក់ចំពោះថ្នាក់សំខាន់មួយ។ [3]

  • មិនអើពើនឹងភាពមិនស្មើគ្នានៃវណ្ណៈ ហើយបន្ទាប់មកឆ្ងល់ថាហេតុអ្វីបានជាព្រឹត្តិការណ៍កម្រៗបាត់ទៅវិញ។.

  • ការបង្កើន​សមត្ថភាព​ហួសហេតុ​រហូតដល់​គំរូ​រៀន​ពី​វត្ថុ​សិប្បនិម្មិត។.

  • រំលងការក្រិតតាមខ្នាតកាមេរ៉ា ហើយបន្ទាប់មកប្រយុទ្ធប្រឆាំងនឹងកំហុសទស្សនវិស័យជារៀងរហូត។ [4]

  • ជឿលើលេខតារាងពិន្ទុដោយមិនចម្លងការរៀបចំការវាយតម្លៃពិតប្រាកដ។ [2][3]


ប្រភពដែលគួរចំណាំ 🔗

ប្រសិនបើអ្នកចូលចិត្តសម្ភារៈបឋម និងកំណត់ចំណាំវគ្គសិក្សា ទាំងនេះគឺជាឯកសារយោងដ៏ល្អសម្រាប់មូលដ្ឋានគ្រឹះ ការអនុវត្ត និងស្តង់ដារ។ សូមមើល ឯកសារយោង សម្រាប់តំណភ្ជាប់៖ កំណត់ចំណាំ CS231n ឯកសារបញ្ហាប្រឈម ImageNet ឯកសារសំណុំទិន្នន័យ/វាយតម្លៃ COCO ឯកសារ OpenCV និងរបាយការណ៍ NIST FRVT។ [1][2][3][4][5]


កំណត់ចំណាំចុងក្រោយ - ឬវែងពេក មិនបានអាន 🍃

ចក្ខុវិស័យកុំព្យូទ័រនៅក្នុង AI ប្រែក្លាយភីកសែលទៅជាការសម្រេចចិត្ត។ វាភ្លឺចែងចាំងនៅពេលអ្នកផ្គូផ្គងភារកិច្ចត្រឹមត្រូវជាមួយនឹងទិន្នន័យត្រឹមត្រូវ វាស់វែងរបស់ត្រឹមត្រូវ និងធ្វើម្តងទៀតជាមួយនឹងវិន័យមិនធម្មតា។ ឧបករណ៍គឺធំទូលាយ ស្តង់ដារគឺជាសាធារណៈ ហើយផ្លូវពីគំរូដើមទៅផលិតកម្មគឺខ្លីគួរឱ្យភ្ញាក់ផ្អើល ប្រសិនបើអ្នកផ្តោតលើការសម្រេចចិត្តចុងក្រោយ។ ធ្វើឱ្យស្លាករបស់អ្នកត្រង់ ជ្រើសរើសម៉ែត្រដែលត្រូវនឹងផលប៉ះពាល់ ហើយអនុញ្ញាតឱ្យគំរូធ្វើការធ្ងន់។ ហើយប្រសិនបើពាក្យប្រៀបធៀបជួយ - សូមគិតអំពីវាដូចជាការបង្រៀនអ្នកហាត់ការដែលលឿនណាស់ ប៉ុន្តែត្រង់ៗ ឱ្យរកឃើញអ្វីដែលសំខាន់។ អ្នកបង្ហាញឧទាហរណ៍ កែកំហុស ហើយទុកចិត្តវាបន្តិចម្តងៗជាមួយនឹងការងារពិតប្រាកដ។ មិនល្អឥតខ្ចោះទេ ប៉ុន្តែជិតគ្រប់គ្រាន់ដើម្បីផ្លាស់ប្តូរ។ 🌟


ឯកសារយោង

  1. CS231n៖ ការរៀនសូត្រស៊ីជម្រៅសម្រាប់ចក្ខុវិស័យកុំព្យូទ័រ (កំណត់ចំណាំវគ្គសិក្សា) - សាកលវិទ្យាល័យស្ទែនហ្វដ។
    អានបន្ថែម

  2. ការប្រកួតប្រជែងទទួលស្គាល់រូបភាពទ្រង់ទ្រាយធំរបស់ ImageNet (ឯកសារ) - Russakovsky et al.
    អានបន្ថែម

  3. សំណុំទិន្នន័យ និងការវាយតម្លៃ COCO - គេហទំព័រផ្លូវការ (និយមន័យភារកិច្ច និងអនុសញ្ញា mAP/IoU)។
    អានបន្ថែម

  4. ឯកសារ OpenCV (v4.x) - ម៉ូឌុលសម្រាប់ដំណើរការជាមុន ការក្រិតតាមខ្នាត រូបរាងវិទ្យា។ល។
    អានបន្ថែម

  5. NIST FRVT ផ្នែកទី 3៖ ផលប៉ះពាល់ប្រជាសាស្ត្រ (NISTIR 8280) - ការវាយតម្លៃឯករាជ្យនៃភាពត្រឹមត្រូវនៃការសម្គាល់មុខនៅទូទាំងប្រជាសាស្ត្រ។
    អានបន្ថែម

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ