តើ AI រកឃើញភាពមិនប្រក្រតីយ៉ាងដូចម្តេច?

តើ AI រកឃើញភាពមិនប្រក្រតីយ៉ាងដូចម្តេច?

ការរកឃើញភាពមិនប្រក្រតីគឺជាវីរបុរសស្ងប់ស្ងាត់នៃប្រតិបត្តិការទិន្នន័យ - ឧបករណ៍រោទិ៍ផ្សែងដែលខ្សឹបខ្សៀវមុនពេលវត្ថុឆេះ។

និយាយឱ្យសាមញ្ញទៅ៖ បញ្ញាសិប្បនិម្មិត (AI) រៀនពីរូបរាងរបស់ “ធម្មតា” ផ្តល់ ពិន្ទុមិនប្រក្រតី ហើយបន្ទាប់មកសម្រេចចិត្តថាតើត្រូវកំណត់មនុស្សម្នាក់ (ឬរារាំងវាដោយស្វ័យប្រវត្តិ) ដោយផ្អែកលើ កម្រិតកំណត់ ។ ចំណុចអាក្រក់គឺស្ថិតនៅក្នុងរបៀបដែលអ្នកកំណត់ “ធម្មតា” នៅពេលដែលទិន្នន័យរបស់អ្នកមានរដូវកាល រញ៉េរញ៉ៃ រសាត់អណ្តែត និងពេលខ្លះកុហកអ្នក។ [1]

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 ហេតុអ្វីបានជា AI អាចបង្កគ្រោះថ្នាក់ដល់សង្គម
ពិនិត្យមើលហានិភ័យសីលធម៌ សេដ្ឋកិច្ច និងសង្គមនៃការទទួលយក AI យ៉ាងទូលំទូលាយ។

🔗 បរិមាណទឹកដែលប្រព័ន្ធ AI ពិតជាប្រើប្រាស់
ពន្យល់ពីភាពត្រជាក់នៃមជ្ឈមណ្ឌលទិន្នន័យ តម្រូវការបណ្តុះបណ្តាល និងផលប៉ះពាល់ទឹកលើបរិស្ថាន។

🔗 តើសំណុំទិន្នន័យ AI ជាអ្វី និងមូលហេតុដែលវាសំខាន់
កំណត់សំណុំទិន្នន័យ ការដាក់ស្លាក ប្រភព និងតួនាទីរបស់វានៅក្នុងការអនុវត្តគំរូ។

🔗 របៀបដែល AI ព្យាករណ៍និន្នាការពីទិន្នន័យស្មុគស្មាញ
គ្របដណ្តប់លើការសម្គាល់លំនាំ គំរូរៀនម៉ាស៊ីន និងការប្រើប្រាស់ការព្យាករណ៍ក្នុងពិភពពិត។


«តើ AI រកឃើញភាពមិនប្រក្រតីដោយរបៀបណា?» 

ចម្លើយល្អគួរតែធ្វើច្រើនជាងការរាយបញ្ជីក្បួនដោះស្រាយ។ វាគួរតែពន្យល់ពីមេកានិច និង អ្វីដែលវាមើលទៅដូចនៅពេលអ្នកអនុវត្តវាទៅលើទិន្នន័យពិត និងមិនល្អឥតខ្ចោះ។ ការពន្យល់ដ៏ល្អបំផុត៖

  • បង្ហាញគ្រឿងផ្សំជាមូលដ្ឋាន៖ លក្ខណៈពិសេស បន្ទាត់ គោល ពិន្ទុ និង កម្រិតកំណត់ ។ [1]

  • ប្រៀបធៀបគ្រួសារជាក់ស្តែង៖ ចម្ងាយ ដង់ស៊ីតេ ថ្នាក់តែមួយ ភាពឯកោ ប្រូបាប៊ីលីតេនិយម ការកសាងឡើងវិញ។ [1]

  • ដោះស្រាយភាពចម្លែកនៃស៊េរីពេលវេលា៖ “ធម្មតា” អាស្រ័យលើពេលវេលានៃថ្ងៃ ថ្ងៃនៃសប្តាហ៍ ការចេញផ្សាយ និងថ្ងៃឈប់សម្រាក។ [1]

  • ចាត់ទុកការវាយតម្លៃដូចជាការរឹតបន្តឹងពិតប្រាកដមួយ៖ ការជូនដំណឹងមិនពិតមិនត្រឹមតែរំខានប៉ុណ្ណោះទេ - វាបំផ្លាញទំនុកចិត្ត។ [4]

  • រួមបញ្ចូលការបកស្រាយ + ការជួយជ្រោមជ្រែងពីមនុស្ស ពីព្រោះ "វាចម្លែក" មិនមែនជាមូលហេតុចម្បងនោះទេ។ [5]


មេកានិចស្នូល៖ បន្ទាត់មូលដ្ឋាន ពិន្ទុ កម្រិតកំណត់ 🧠

ប្រព័ន្ធមិនប្រក្រតីភាគច្រើន - ទាំងស្អាតទាំងមិនស្អាត - សង្ខេបមកត្រឹមផ្នែកដែលមានចលនាបី៖

១) ការតំណាង (ហៅកាត់ថា អ្វីដែលគំរូ ឃើញ )

សញ្ញាឆៅកម្រគ្រប់គ្រាន់ណាស់។ អ្នកអាច បង្កើតលក្ខណៈពិសេស (ស្ថិតិរំកិល សមាមាត្រ ភាពយឺតយ៉ាវ ឌីតាតាមរដូវ) ឬ រៀនតំណាង (ការបង្កប់ លំហរង ការកសាងឡើងវិញ)។ [1]

២) ការដាក់ពិន្ទុ (ហៅកាត់ថា៖ តើនេះ "ចម្លែក" ប៉ុណ្ណា?)

គំនិត​ទូទៅ​សម្រាប់​ការ​ដាក់​ពិន្ទុ​រួមមាន៖

  • ផ្អែកលើចម្ងាយ ៖ ឆ្ងាយពីអ្នកជិតខាង = គួរឱ្យសង្ស័យ។ [1]

  • ផ្អែកលើដង់ស៊ីតេ ៖ ដង់ស៊ីតេក្នុងស្រុកទាប = គួរឱ្យសង្ស័យ (LOF គឺជាកូនគំរូ)។ [1]

  • ព្រំដែនថ្នាក់មួយ ៖ រៀនពាក្យ “ធម្មតា” សម្គាល់អ្វីដែលស្ថិតនៅខាងក្រៅ។ [1]

  • ប្រូបាប៊ីលីតេ ៖ លទ្ធភាពទាបក្រោមគំរូដែលបានបំពាក់ = គួរឱ្យសង្ស័យ។ [1]

  • កំហុសក្នុងការកសាងឡើងវិញ ៖ ប្រសិនបើគំរូដែលបានហ្វឹកហាត់លើធម្មតាមិនអាចកសាងវាឡើងវិញបានទេ វាទំនងជាបិទ។ [1]

៣) ការកំណត់កម្រិត (ហៅម្យ៉ាងទៀតថា ពេលណាត្រូវរោទ៍កណ្តឹង)

កម្រិត​កំណត់​អាច​ជា​ថេរ ផ្អែកលើ​បរិមាណ ក្នុងមួយ​ផ្នែក ឬ​ងាយ​រងគ្រោះ​ដោយ​ការចំណាយ - ប៉ុន្តែ​វា​គួរតែ​ត្រូវ​បាន ​ក្រិត ​តាម​ថវិកា​ដែល​បាន​ប្រុងប្រយ័ត្ន និង​ការចំណាយ​បន្ទាប់បន្សំ មិនមែន​ភាព​រំជើបរំជួល​ទេ។ [4]

ព័ត៌មានលម្អិតជាក់ស្តែងមួយ៖ ឧបករណ៍ចាប់សញ្ញា outlier/novelty របស់ scikit-learn បង្ហាញ ពិន្ទុឆៅ ហើយបន្ទាប់មកអនុវត្ត កម្រិត (ជារឿយៗត្រូវបានគ្រប់គ្រងតាមរយៈការសន្មត់បែបការបំពុល) ដើម្បីបំប្លែងពិន្ទុទៅជាការសម្រេចចិត្ត inlier/outlier។ [2]


និយមន័យរហ័សដែលការពារការឈឺចាប់នៅពេលក្រោយ 🧯

ភាពខុសគ្នាពីរដែលជួយសង្រ្គោះអ្នកពីកំហុសឆ្គងបន្តិចបន្តួច៖

  • ការរកឃើញ​អសមភាព ៖ ទិន្នន័យ​ហ្វឹកហ្វឺន​របស់អ្នក​អាចរួមបញ្ចូល​អសមភាព​រួចហើយ។ ក្បួនដោះស្រាយ​ព្យាយាម​ធ្វើគំរូ​លើ "តំបន់​ធម្មតា​ក្រាស់" យ៉ាងណាក៏ដោយ។

  • ការរកឃើញភាពថ្មីថ្មោង ៖ ទិន្នន័យបណ្តុះបណ្តាលត្រូវបានសន្មតថាស្អាតស្អំ។ អ្នកកំពុងវិនិច្ឆ័យថាតើ ថ្មី សមនឹងគំរូធម្មតាដែលបានរៀនឬអត់។ [2]

ដូចគ្នានេះដែរ៖ ការរកឃើញភាពថ្មីថ្មោងច្រើនតែត្រូវបានកំណត់ថាជា ចំណាត់ថ្នាក់ថ្នាក់តែមួយ - ការធ្វើគំរូធម្មតា ពីព្រោះឧទាហរណ៍មិនប្រក្រតីគឺកម្រមាន ឬមិនបានកំណត់។ [1]

 

ភាពមិនប្រក្រតីនៃ AI កំហុសឆ្គង

សេះធ្វើការដែលគ្មានការត្រួតពិនិត្យដែលអ្នកពិតជានឹងប្រើប្រាស់ 🧰

នៅពេលដែលស្លាកមានកម្រិត (ដែលជាទូទៅតែងតែមាន) ទាំងនេះគឺជាឧបករណ៍ដែលបង្ហាញនៅក្នុងបំពង់បង្ហូរទិន្នន័យពិតប្រាកដ៖

  • Isolation Forest ៖ ជាលំនាំដើមដ៏រឹងមាំមួយនៅក្នុងករណីតារាងជាច្រើន ដែលត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយនៅក្នុងការអនុវត្ត និងត្រូវបានអនុវត្តនៅក្នុង scikit-learn។ [2]

  • SVM ថ្នាក់តែមួយ ៖ អាចមានប្រសិទ្ធភាព ប៉ុន្តែងាយនឹងរងឥទ្ធិពលពីការលៃតម្រូវ និងការសន្មត់។ scikit-learn បញ្ជាក់យ៉ាងច្បាស់អំពីតម្រូវការសម្រាប់ការលៃតម្រូវប៉ារ៉ាម៉ែត្រអ៊ីពែរប្រាម៉ែត្រដោយប្រុងប្រយ័ត្ន។ [2]

  • កត្តា​ក្រៅ​តំបន់ (LOF) ៖ ការ​ដាក់​ពិន្ទុ​ផ្អែក​លើ​ដង់ស៊ីតេ​បុរាណ; ល្អ​នៅ​ពេល​ដែល "ធម្មតា" មិន​មែន​ជា​ដុំ​តូចៗ​ស្អាត។ [1]

ក្រុម gotcha ជាក់ស្តែងមួយបានរកឃើញឡើងវិញជារៀងរាល់សប្តាហ៍៖ LOF មានឥរិយាបទខុសគ្នាអាស្រ័យលើថាតើអ្នកកំពុងធ្វើការរកឃើញ outlier លើសំណុំហ្វឹកហាត់ ធៀបនឹងការរកឃើញ novelty លើទិន្នន័យថ្មី - scikit-learn ថែមទាំងតម្រូវឱ្យមាន novelty=True ដើម្បីទទួលបានពិន្ទុដែលមើលមិនឃើញដោយសុវត្ថិភាព។ [2]


មូលដ្ឋានរឹងមាំមួយដែលនៅតែដំណើរការនៅពេលដែលទិន្នន័យមានភាពមិនច្បាស់លាស់ 🪓

ប្រសិនបើអ្នកស្ថិតនៅក្នុងរបៀប "យើងគ្រាន់តែត្រូវការអ្វីមួយដែលមិនធ្វើឱ្យយើងភ្លេចភ្លាំង" ស្ថិតិរឹងមាំត្រូវបានវាយតម្លៃទាប។

ពិន្ទុ z ដែលបានកែប្រែ ប្រើ មេឌីយ៉ាន និង MAD (គម្លាតដាច់ខាតមេឌីយ៉ាន) ដើម្បីកាត់បន្ថយភាពរសើបចំពោះតម្លៃខ្លាំង។ សៀវភៅណែនាំ EDA របស់ NIST ចងក្រងឯកសារអំពីទម្រង់ពិន្ទុ z ដែលបានកែប្រែ ហើយកត់សម្គាល់ពីច្បាប់មេដៃ "សក្តានុពលក្រៅប្រព័ន្ធ" ដែលត្រូវបានគេប្រើជាទូទៅនៅតម្លៃដាច់ខាតលើសពី 3.5 ។ [3]

ការធ្វើបែបនេះនឹងមិនដោះស្រាយបញ្ហាមិនប្រក្រតីទាំងអស់នោះទេ - ប៉ុន្តែជារឿយៗវាជាខ្សែការពារដំបូងដ៏រឹងមាំ ជាពិសេសសម្រាប់ម៉ែត្រិចដែលមានសំឡេងរំខាន និងការត្រួតពិនិត្យដំណាក់កាលដំបូង។ [3]


ភាពពិតនៃស៊េរីពេលវេលា៖ “ធម្មតា” អាស្រ័យលើពេលណា ⏱️📈

ភាពមិនប្រក្រតីនៃស៊េរីពេលវេលាគឺពិបាក ពីព្រោះបរិបទគឺជាចំណុចសំខាន់ទាំងមូល៖ ការកើនឡើងយ៉ាងខ្លាំងនៅពេលថ្ងៃត្រង់អាចត្រូវបានគេរំពឹងទុក។ ការកើនឡើងដូចគ្នានៅម៉ោង 3 ព្រឹកអាចមានន័យថាមានអ្វីមួយកំពុងឆេះ។ ដូច្នេះប្រព័ន្ធជាក់ស្តែងជាច្រើនធ្វើគំរូនៃភាពធម្មតាដោយប្រើ លក្ខណៈពិសេសដែលដឹងពីពេលវេលា (ភាពយឺតយ៉ាវ ឌីតាតាមរដូវ បង្អួចរំកិល) និងគម្លាតពិន្ទុទាក់ទងទៅនឹងគំរូដែលរំពឹងទុក។ [1]

ប្រសិនបើអ្នកចាំបានតែច្បាប់មួយប៉ុណ្ណោះ៖ សូមបែងចែកបន្ទាត់មូលដ្ឋានរបស់អ្នក (ម៉ោង/ថ្ងៃ/តំបន់/កម្រិតសេវាកម្ម) មុនពេលអ្នកប្រកាសថាពាក់កណ្តាលនៃចរាចរណ៍របស់អ្នក "មិនប្រក្រតី"។ [1]


ការវាយតម្លៃ៖ អន្ទាក់ព្រឹត្តិការណ៍កម្រ 🧪

ការរកឃើញភាពមិនប្រក្រតីច្រើនតែជា "ម្ជុលក្នុងគំនរចំបើង" ដែលធ្វើឱ្យការវាយតម្លៃចម្លែក៖

  • ខ្សែកោង ROC អាចមើលទៅល្អមែនទែន នៅពេលដែលភាពវិជ្ជមានកម្រមាន។

  • ទស្សនៈ​នៃ​ការ​រំលឹក​ឡើង​វិញ​ដោយ​ភាព​ជាក់លាក់​ច្រើន​តែ​ផ្តល់​ព័ត៌មាន​ច្រើន​ជាង​សម្រាប់​ការ​កំណត់​ដែល​មិន​មាន​តុល្យភាព ពី​ព្រោះ​វា​ផ្តោត​លើ​ការ​អនុវត្ត​លើ​ថ្នាក់​វិជ្ជមាន។ [4]

  • ទាក់ទងនឹងប្រតិបត្តិការ អ្នកក៏ត្រូវការ ថវិកាជូនដំណឹង ៖ តើមនុស្សអាចរៀបចំការជូនដំណឹងបានប៉ុន្មានក្នុងមួយម៉ោងដោយមិនឈប់ខឹង? [4]

ការធ្វើតេស្តថយក្រោយឆ្លងកាត់បង្អួចរំកិលជួយអ្នកឱ្យចាប់យករបៀបបរាជ័យបុរាណ៖ "វាដំណើរការយ៉ាងស្រស់ស្អាត... លើការចែកចាយខែមុន។" [1]


ការបកស្រាយ និងមូលហេតុចម្បង៖ បង្ហាញការងាររបស់អ្នក 🪄

ការជូនដំណឹងដោយគ្មានការពន្យល់គឺដូចជាការទទួលបានកាតប៉ុស្តាល់អាថ៌កំបាំងមួយ។ មានប្រយោជន៍ ប៉ុន្តែគួរឱ្យខកចិត្ត។

ឧបករណ៍បកស្រាយអាចជួយបានដោយចង្អុលបង្ហាញថា តើលក្ខណៈពិសេសណាខ្លះដែលរួមចំណែកច្រើនបំផុត ដល់ពិន្ទុភាពមិនប្រក្រតី ឬដោយផ្តល់ការពន្យល់អំពីរចនាប័ទ្ម "អ្វីដែលត្រូវការផ្លាស់ប្តូរដើម្បីឱ្យវាមើលទៅធម្មតា?"។ Interpretable Machine Learning គឺជាមគ្គុទ្ទេសក៍ដ៏រឹងមាំ និងសំខាន់មួយចំពោះវិធីសាស្រ្តទូទៅ (រួមទាំងការបញ្ជាក់រចនាប័ទ្ម SHAP) និងដែនកំណត់របស់វា។ [5]

គោលដៅមិនមែនគ្រាន់តែជាការលួងលោមអ្នកពាក់ព័ន្ធនោះទេ - វាគឺជាការតម្រៀបលឿនជាងមុន និងឧប្បត្តិហេតុដដែលៗតិចជាងមុន។


ការដាក់ពង្រាយ ការរសាត់ និងរង្វិលជុំមតិប្រតិកម្ម 🚀

ម៉ូដែលមិនរស់នៅក្នុងស្លាយទេ ពួកគេរស់នៅក្នុងបំពង់បង្ហូរ។

រឿងរ៉ាវទូទៅមួយអំពី "ខែដំបូងក្នុងផលិតកម្ម"៖ ឧបករណ៍ចាប់សញ្ញាភាគច្រើនដាក់ទង់ជាតិលើការដាក់ពង្រាយ ការងារជាបាច់ និងទិន្នន័យដែលបាត់... ដែល នៅតែមានប្រយោជន៍ ព្រោះវាបង្ខំអ្នកឱ្យបំបែក "ឧប្បត្តិហេតុគុណភាពទិន្នន័យ" ពី "ភាពមិនប្រក្រតីនៃអាជីវកម្ម"។

ក្នុងការអនុវត្ត៖

  • តាមដានការរសាត់បាត់ និងហ្វឹកហាត់ឡើងវិញ/ក្រិតតាមខ្នាតឡើងវិញ នៅពេលដែលឥរិយាបថផ្លាស់ប្តូរ។ [1]

  • ការបញ្ចូលពិន្ទុកំណត់ហេតុ + កំណែគំរូ ដូច្នេះអ្នកអាចបង្កើតឡើងវិញនូវមូលហេតុដែលអ្វីមួយត្រូវបានបង្ហោះជាទំព័រ។ [5]

  • ចាប់យកមតិប្រតិកម្មរបស់មនុស្ស (ការជូនដំណឹងមានប្រយោជន៍ ធៀបនឹងការជូនដំណឹងដែលមានសំឡេងរំខាន) ដើម្បីកែសម្រួលកម្រិតកំណត់ និងផ្នែកនានាតាមពេលវេលា។ [4]


មុំសុវត្ថិភាព៖ IDS និងការវិភាគឥរិយាបថ 🛡️

ក្រុមសន្តិសុខច្រើនតែលាយបញ្ចូលគ្នានូវគំនិតមិនប្រក្រតីជាមួយនឹងការរកឃើញដែលមានមូលដ្ឋានលើច្បាប់៖ បន្ទាត់មូលដ្ឋានសម្រាប់ "ឥរិយាបថម៉ាស៊ីនធម្មតា" បូករួមទាំងហត្ថលេខា និងគោលការណ៍សម្រាប់គំរូអាក្រក់ដែលគេស្គាល់។ SP 800-94 (ចុងក្រោយ) របស់ NIST នៅតែជាក្របខ័ណ្ឌដែលត្រូវបានលើកឡើងយ៉ាងទូលំទូលាយសម្រាប់ការពិចារណាប្រព័ន្ធរកឃើញ និងការបង្ការការឈ្លានពាន។ វាក៏កត់សម្គាល់ផងដែរថាសេចក្តីព្រាងឆ្នាំ 2012 "Rev. 1" មិនដែលក្លាយជាចុងក្រោយទេ ហើយក្រោយមកត្រូវបានលុបចោល។ [3]

ការបកប្រែ៖ ប្រើ ML ដែលវាជួយបាន ប៉ុន្តែកុំបោះចោលច្បាប់គួរឱ្យធុញ - ពួកវាគួរឱ្យធុញព្រោះវាដំណើរការ។


តារាងប្រៀបធៀប៖ វិធីសាស្រ្តពេញនិយមដោយសង្ខេប 📊

ឧបករណ៍ / វិធីសាស្រ្ត ល្អបំផុតសម្រាប់ ហេតុអ្វីបានជាវាដំណើរការ (ក្នុងការអនុវត្ត)
ពិន្ទុ z រឹងមាំ / កែប្រែ រង្វាស់សាមញ្ញ មូលដ្ឋានរហ័ស ការឆ្លងកាត់លើកដំបូងដ៏រឹងមាំ នៅពេលដែលអ្នកត្រូវការ "ល្អគ្រប់គ្រាន់" និងការជូនដំណឹងមិនពិតតិចជាងមុន។ [3]
ព្រៃឯកោ តារាង, លក្ខណៈពិសេសចម្រុះ ការអនុវត្តលំនាំដើមដ៏រឹងមាំ និងត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយក្នុងការអនុវត្ត។ [2]
SVM ថ្នាក់តែមួយ តំបន់ "ធម្មតា" បង្រួម ការរកឃើញភាពថ្មីថ្មោងដោយផ្អែកលើព្រំដែន; ការលៃតម្រូវមានសារៈសំខាន់ខ្លាំងណាស់។ [2]
កត្តា Outlier ក្នុងស្រុក ធម្មតា​ដូច​ម៉ានីហ្វូល ភាពផ្ទុយគ្នានៃដង់ស៊ីតេទល់នឹងអ្នកជិតខាងចាប់យកភាពចម្លែកក្នុងស្រុក។ [1]
កំហុសក្នុងការកសាងឡើងវិញ (ឧទាហរណ៍ រចនាប័ទ្ម​អ៊ិនកូដឌ័រដោយស្វ័យប្រវត្តិ) លំនាំវិមាត្រខ្ពស់ ហ្វឹកហាត់លើផ្លូវធម្មតា។ កំហុសក្នុងការកសាងឡើងវិញធំៗអាចបង្ហាញពីគម្លាត។ [1]

កូដបន្លំ៖ ចាប់ផ្តើមជាមួយនឹងបន្ទាត់មូលដ្ឋានរឹងមាំ + វិធីសាស្រ្តដែលគួរឱ្យធុញដែលមិនមានការត្រួតពិនិត្យ បន្ទាប់មកបន្ថែមភាពស្មុគស្មាញតែកន្លែងដែលវាបង់ថ្លៃជួលប៉ុណ្ណោះ។


សៀវភៅណែនាំខ្នាតតូច៖ ពីសូន្យដល់ការជូនដំណឹង 🧭

  1. សូមកំណត់ពាក្យ “ចម្លែក” ក្នុងន័យប្រតិបត្តិការ (ភាពយឺតយ៉ាវ ហានិភ័យនៃការក្លែងបន្លំ ការវាយប្រហារ CPU ហានិភ័យនៃសារពើភ័ណ្ឌ)។

  2. ចាប់ផ្តើមជាមួយនឹងមូលដ្ឋាន (ស្ថិតិរឹងមាំ ឬកម្រិតដែលបានបែងចែក)។ [3]

  3. ជ្រើសរើសម៉ូដែលដែលមិនបានត្រួតពិនិត្យមួយ ជាការឆ្លងកាត់លើកដំបូង (ព្រៃឯកោ / LOF / SVM ថ្នាក់តែមួយ)។ [2]

  4. កំណត់កម្រិតជាមួយនឹងថវិកាដែលបានប្រុងប្រយ័ត្ន ហើយវាយតម្លៃដោយប្រើការគិតបែប PR ប្រសិនបើភាពវិជ្ជមានកម្រមាន។ [4]

  5. បន្ថែមការពន្យល់ + ការកត់ត្រា ដើម្បីឱ្យការជូនដំណឹងនីមួយៗអាចបង្កើតឡើងវិញបាន និងអាចបំបាត់កំហុសបាន។ [5]

  6. ការធ្វើតេស្តឡើងវិញ បញ្ជូន រៀន ក្រិតតាមខ្នាតឡើងវិញ - ការរសាត់បាត់គឺជារឿងធម្មតា។ [1]

អ្នកពិតជាអាចធ្វើបែបនេះបានក្នុងរយៈពេលមួយសប្តាហ៍… ដោយសន្មតថាត្រាពេលវេលារបស់អ្នកមិនត្រូវបានភ្ជាប់ជាមួយកាសែតស្អិត និងក្តីសង្ឃឹមនោះទេ។ 😅


កំណត់សម្គាល់ចុងក្រោយ - វែងពេក ខ្ញុំមិនបានអានវាទេ🧾

បញ្ញាសិប្បនិម្មិត (AI) រកឃើញភាពមិនប្រក្រតីដោយរៀនរូបភាពជាក់ស្តែងនៃ "ធម្មតា" ដាក់ពិន្ទុគម្លាត និងដាក់សញ្ញាសម្គាល់អ្វីដែលឆ្លងកាត់កម្រិតកំណត់។ ប្រព័ន្ធល្អបំផុតឈ្នះមិនមែនដោយការភ្លឺចែងចាំងនោះទេ ប៉ុន្តែដោយការក្រិត តាមខ្នាត ៖ បន្ទាត់គោលដែលបានបែងចែកជាផ្នែកៗ ថវិកាជូនដំណឹង លទ្ធផលដែលអាចបកស្រាយបាន និងរង្វិលជុំមតិប្រតិកម្មដែលប្រែក្លាយសំឡេងរោទិ៍ដែលមានសំឡេងរំខានទៅជាសញ្ញាដែលអាចទុកចិត្តបាន។ [1]


ឯកសារយោង

  1. Pimentel et al. (2014) - ការពិនិត្យឡើងវិញអំពីការរកឃើញភាពថ្មីថ្មោង (PDF, សាកលវិទ្យាល័យ Oxford) អានបន្ថែម

  2. ឯកសារ scikit-learn - ការរកឃើញភាពថ្មីថ្មោង និងភាពមិនប្រក្រតី អានបន្ថែម

  3. សៀវភៅណែនាំអេឡិចត្រូនិច NIST/SEMATECH - ការរកឃើញចំណុចខ្សោយ អានបន្ថែម និង NIST CSRC - SP 800-94 (ចុងក្រោយ): ការណែនាំអំពីប្រព័ន្ធរកឃើញ និងការពារការឈ្លានពាន (IDPS) អានបន្ថែម

  4. Saito & Rehmsmeier (2015) - គំនូសតាង Precision-Recall មានព័ត៌មានច្រើនជាងគំនូសតាង ROC នៅពេលវាយតម្លៃឧបករណ៍ចាត់ថ្នាក់ប្រព័ន្ធគោលពីរលើសំណុំទិន្នន័យមិនមានតុល្យភាព (PLOS ONE) អានបន្ថែម

  5. Molnar - ការរៀនម៉ាស៊ីនដែលអាចបកស្រាយបាន (សៀវភៅគេហទំព័រ) អានបន្ថែម

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ