ការរកឃើញភាពមិនប្រក្រតីគឺជាវីរបុរសស្ងប់ស្ងាត់នៃប្រតិបត្តិការទិន្នន័យ - ឧបករណ៍រោទិ៍ផ្សែងដែលខ្សឹបខ្សៀវមុនពេលវត្ថុឆេះ។
និយាយឱ្យសាមញ្ញទៅ៖ បញ្ញាសិប្បនិម្មិត (AI) រៀនពីរូបរាងរបស់ “ធម្មតា” ផ្តល់ ពិន្ទុមិនប្រក្រតី ហើយបន្ទាប់មកសម្រេចចិត្តថាតើត្រូវកំណត់មនុស្សម្នាក់ (ឬរារាំងវាដោយស្វ័យប្រវត្តិ) ដោយផ្អែកលើ កម្រិតកំណត់ ។ ចំណុចអាក្រក់គឺស្ថិតនៅក្នុងរបៀបដែលអ្នកកំណត់ “ធម្មតា” នៅពេលដែលទិន្នន័យរបស់អ្នកមានរដូវកាល រញ៉េរញ៉ៃ រសាត់អណ្តែត និងពេលខ្លះកុហកអ្នក។ [1]
អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖
🔗 ហេតុអ្វីបានជា AI អាចបង្កគ្រោះថ្នាក់ដល់សង្គម
ពិនិត្យមើលហានិភ័យសីលធម៌ សេដ្ឋកិច្ច និងសង្គមនៃការទទួលយក AI យ៉ាងទូលំទូលាយ។
🔗 បរិមាណទឹកដែលប្រព័ន្ធ AI ពិតជាប្រើប្រាស់
ពន្យល់ពីភាពត្រជាក់នៃមជ្ឈមណ្ឌលទិន្នន័យ តម្រូវការបណ្តុះបណ្តាល និងផលប៉ះពាល់ទឹកលើបរិស្ថាន។
🔗 តើសំណុំទិន្នន័យ AI ជាអ្វី និងមូលហេតុដែលវាសំខាន់
កំណត់សំណុំទិន្នន័យ ការដាក់ស្លាក ប្រភព និងតួនាទីរបស់វានៅក្នុងការអនុវត្តគំរូ។
🔗 របៀបដែល AI ព្យាករណ៍និន្នាការពីទិន្នន័យស្មុគស្មាញ
គ្របដណ្តប់លើការសម្គាល់លំនាំ គំរូរៀនម៉ាស៊ីន និងការប្រើប្រាស់ការព្យាករណ៍ក្នុងពិភពពិត។
«តើ AI រកឃើញភាពមិនប្រក្រតីដោយរបៀបណា?»
ចម្លើយល្អគួរតែធ្វើច្រើនជាងការរាយបញ្ជីក្បួនដោះស្រាយ។ វាគួរតែពន្យល់ពីមេកានិច និង អ្វីដែលវាមើលទៅដូចនៅពេលអ្នកអនុវត្តវាទៅលើទិន្នន័យពិត និងមិនល្អឥតខ្ចោះ។ ការពន្យល់ដ៏ល្អបំផុត៖
-
បង្ហាញគ្រឿងផ្សំជាមូលដ្ឋាន៖ លក្ខណៈពិសេស បន្ទាត់ គោល ពិន្ទុ និង កម្រិតកំណត់ ។ [1]
-
ប្រៀបធៀបគ្រួសារជាក់ស្តែង៖ ចម្ងាយ ដង់ស៊ីតេ ថ្នាក់តែមួយ ភាពឯកោ ប្រូបាប៊ីលីតេនិយម ការកសាងឡើងវិញ។ [1]
-
ដោះស្រាយភាពចម្លែកនៃស៊េរីពេលវេលា៖ “ធម្មតា” អាស្រ័យលើពេលវេលានៃថ្ងៃ ថ្ងៃនៃសប្តាហ៍ ការចេញផ្សាយ និងថ្ងៃឈប់សម្រាក។ [1]
-
ចាត់ទុកការវាយតម្លៃដូចជាការរឹតបន្តឹងពិតប្រាកដមួយ៖ ការជូនដំណឹងមិនពិតមិនត្រឹមតែរំខានប៉ុណ្ណោះទេ - វាបំផ្លាញទំនុកចិត្ត។ [4]
-
រួមបញ្ចូលការបកស្រាយ + ការជួយជ្រោមជ្រែងពីមនុស្ស ពីព្រោះ "វាចម្លែក" មិនមែនជាមូលហេតុចម្បងនោះទេ។ [5]
មេកានិចស្នូល៖ បន្ទាត់មូលដ្ឋាន ពិន្ទុ កម្រិតកំណត់ 🧠
ប្រព័ន្ធមិនប្រក្រតីភាគច្រើន - ទាំងស្អាតទាំងមិនស្អាត - សង្ខេបមកត្រឹមផ្នែកដែលមានចលនាបី៖
១) ការតំណាង (ហៅកាត់ថា អ្វីដែលគំរូ ឃើញ )
សញ្ញាឆៅកម្រគ្រប់គ្រាន់ណាស់។ អ្នកអាច បង្កើតលក្ខណៈពិសេស (ស្ថិតិរំកិល សមាមាត្រ ភាពយឺតយ៉ាវ ឌីតាតាមរដូវ) ឬ រៀនតំណាង (ការបង្កប់ លំហរង ការកសាងឡើងវិញ)។ [1]
២) ការដាក់ពិន្ទុ (ហៅកាត់ថា៖ តើនេះ "ចម្លែក" ប៉ុណ្ណា?)
គំនិតទូទៅសម្រាប់ការដាក់ពិន្ទុរួមមាន៖
-
ផ្អែកលើចម្ងាយ ៖ ឆ្ងាយពីអ្នកជិតខាង = គួរឱ្យសង្ស័យ។ [1]
-
ផ្អែកលើដង់ស៊ីតេ ៖ ដង់ស៊ីតេក្នុងស្រុកទាប = គួរឱ្យសង្ស័យ (LOF គឺជាកូនគំរូ)។ [1]
-
ព្រំដែនថ្នាក់មួយ ៖ រៀនពាក្យ “ធម្មតា” សម្គាល់អ្វីដែលស្ថិតនៅខាងក្រៅ។ [1]
-
ប្រូបាប៊ីលីតេ ៖ លទ្ធភាពទាបក្រោមគំរូដែលបានបំពាក់ = គួរឱ្យសង្ស័យ។ [1]
-
កំហុសក្នុងការកសាងឡើងវិញ ៖ ប្រសិនបើគំរូដែលបានហ្វឹកហាត់លើធម្មតាមិនអាចកសាងវាឡើងវិញបានទេ វាទំនងជាបិទ។ [1]
៣) ការកំណត់កម្រិត (ហៅម្យ៉ាងទៀតថា ពេលណាត្រូវរោទ៍កណ្តឹង)
កម្រិតកំណត់អាចជាថេរ ផ្អែកលើបរិមាណ ក្នុងមួយផ្នែក ឬងាយរងគ្រោះដោយការចំណាយ - ប៉ុន្តែវាគួរតែត្រូវបាន ក្រិត តាមថវិកាដែលបានប្រុងប្រយ័ត្ន និងការចំណាយបន្ទាប់បន្សំ មិនមែនភាពរំជើបរំជួលទេ។ [4]
ព័ត៌មានលម្អិតជាក់ស្តែងមួយ៖ ឧបករណ៍ចាប់សញ្ញា outlier/novelty របស់ scikit-learn បង្ហាញ ពិន្ទុឆៅ ហើយបន្ទាប់មកអនុវត្ត កម្រិត (ជារឿយៗត្រូវបានគ្រប់គ្រងតាមរយៈការសន្មត់បែបការបំពុល) ដើម្បីបំប្លែងពិន្ទុទៅជាការសម្រេចចិត្ត inlier/outlier។ [2]
និយមន័យរហ័សដែលការពារការឈឺចាប់នៅពេលក្រោយ 🧯
ភាពខុសគ្នាពីរដែលជួយសង្រ្គោះអ្នកពីកំហុសឆ្គងបន្តិចបន្តួច៖
-
ការរកឃើញអសមភាព ៖ ទិន្នន័យហ្វឹកហ្វឺនរបស់អ្នកអាចរួមបញ្ចូលអសមភាពរួចហើយ។ ក្បួនដោះស្រាយព្យាយាមធ្វើគំរូលើ "តំបន់ធម្មតាក្រាស់" យ៉ាងណាក៏ដោយ។
-
ការរកឃើញភាពថ្មីថ្មោង ៖ ទិន្នន័យបណ្តុះបណ្តាលត្រូវបានសន្មតថាស្អាតស្អំ។ អ្នកកំពុងវិនិច្ឆ័យថាតើ ថ្មី សមនឹងគំរូធម្មតាដែលបានរៀនឬអត់។ [2]
ដូចគ្នានេះដែរ៖ ការរកឃើញភាពថ្មីថ្មោងច្រើនតែត្រូវបានកំណត់ថាជា ចំណាត់ថ្នាក់ថ្នាក់តែមួយ - ការធ្វើគំរូធម្មតា ពីព្រោះឧទាហរណ៍មិនប្រក្រតីគឺកម្រមាន ឬមិនបានកំណត់។ [1]

សេះធ្វើការដែលគ្មានការត្រួតពិនិត្យដែលអ្នកពិតជានឹងប្រើប្រាស់ 🧰
នៅពេលដែលស្លាកមានកម្រិត (ដែលជាទូទៅតែងតែមាន) ទាំងនេះគឺជាឧបករណ៍ដែលបង្ហាញនៅក្នុងបំពង់បង្ហូរទិន្នន័យពិតប្រាកដ៖
-
Isolation Forest ៖ ជាលំនាំដើមដ៏រឹងមាំមួយនៅក្នុងករណីតារាងជាច្រើន ដែលត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយនៅក្នុងការអនុវត្ត និងត្រូវបានអនុវត្តនៅក្នុង scikit-learn។ [2]
-
SVM ថ្នាក់តែមួយ ៖ អាចមានប្រសិទ្ធភាព ប៉ុន្តែងាយនឹងរងឥទ្ធិពលពីការលៃតម្រូវ និងការសន្មត់។ scikit-learn បញ្ជាក់យ៉ាងច្បាស់អំពីតម្រូវការសម្រាប់ការលៃតម្រូវប៉ារ៉ាម៉ែត្រអ៊ីពែរប្រាម៉ែត្រដោយប្រុងប្រយ័ត្ន។ [2]
-
កត្តាក្រៅតំបន់ (LOF) ៖ ការដាក់ពិន្ទុផ្អែកលើដង់ស៊ីតេបុរាណ; ល្អនៅពេលដែល "ធម្មតា" មិនមែនជាដុំតូចៗស្អាត។ [1]
ក្រុម gotcha ជាក់ស្តែងមួយបានរកឃើញឡើងវិញជារៀងរាល់សប្តាហ៍៖ LOF មានឥរិយាបទខុសគ្នាអាស្រ័យលើថាតើអ្នកកំពុងធ្វើការរកឃើញ outlier លើសំណុំហ្វឹកហាត់ ធៀបនឹងការរកឃើញ novelty លើទិន្នន័យថ្មី - scikit-learn ថែមទាំងតម្រូវឱ្យមាន novelty=True ដើម្បីទទួលបានពិន្ទុដែលមើលមិនឃើញដោយសុវត្ថិភាព។ [2]
មូលដ្ឋានរឹងមាំមួយដែលនៅតែដំណើរការនៅពេលដែលទិន្នន័យមានភាពមិនច្បាស់លាស់ 🪓
ប្រសិនបើអ្នកស្ថិតនៅក្នុងរបៀប "យើងគ្រាន់តែត្រូវការអ្វីមួយដែលមិនធ្វើឱ្យយើងភ្លេចភ្លាំង" ស្ថិតិរឹងមាំត្រូវបានវាយតម្លៃទាប។
ពិន្ទុ z ដែលបានកែប្រែ ប្រើ មេឌីយ៉ាន និង MAD (គម្លាតដាច់ខាតមេឌីយ៉ាន) ដើម្បីកាត់បន្ថយភាពរសើបចំពោះតម្លៃខ្លាំង។ សៀវភៅណែនាំ EDA របស់ NIST ចងក្រងឯកសារអំពីទម្រង់ពិន្ទុ z ដែលបានកែប្រែ ហើយកត់សម្គាល់ពីច្បាប់មេដៃ "សក្តានុពលក្រៅប្រព័ន្ធ" ដែលត្រូវបានគេប្រើជាទូទៅនៅតម្លៃដាច់ខាតលើសពី 3.5 ។ [3]
ការធ្វើបែបនេះនឹងមិនដោះស្រាយបញ្ហាមិនប្រក្រតីទាំងអស់នោះទេ - ប៉ុន្តែជារឿយៗវាជាខ្សែការពារដំបូងដ៏រឹងមាំ ជាពិសេសសម្រាប់ម៉ែត្រិចដែលមានសំឡេងរំខាន និងការត្រួតពិនិត្យដំណាក់កាលដំបូង។ [3]
ភាពពិតនៃស៊េរីពេលវេលា៖ “ធម្មតា” អាស្រ័យលើពេលណា ⏱️📈
ភាពមិនប្រក្រតីនៃស៊េរីពេលវេលាគឺពិបាក ពីព្រោះបរិបទគឺជាចំណុចសំខាន់ទាំងមូល៖ ការកើនឡើងយ៉ាងខ្លាំងនៅពេលថ្ងៃត្រង់អាចត្រូវបានគេរំពឹងទុក។ ការកើនឡើងដូចគ្នានៅម៉ោង 3 ព្រឹកអាចមានន័យថាមានអ្វីមួយកំពុងឆេះ។ ដូច្នេះប្រព័ន្ធជាក់ស្តែងជាច្រើនធ្វើគំរូនៃភាពធម្មតាដោយប្រើ លក្ខណៈពិសេសដែលដឹងពីពេលវេលា (ភាពយឺតយ៉ាវ ឌីតាតាមរដូវ បង្អួចរំកិល) និងគម្លាតពិន្ទុទាក់ទងទៅនឹងគំរូដែលរំពឹងទុក។ [1]
ប្រសិនបើអ្នកចាំបានតែច្បាប់មួយប៉ុណ្ណោះ៖ សូមបែងចែកបន្ទាត់មូលដ្ឋានរបស់អ្នក (ម៉ោង/ថ្ងៃ/តំបន់/កម្រិតសេវាកម្ម) មុនពេលអ្នកប្រកាសថាពាក់កណ្តាលនៃចរាចរណ៍របស់អ្នក "មិនប្រក្រតី"។ [1]
ការវាយតម្លៃ៖ អន្ទាក់ព្រឹត្តិការណ៍កម្រ 🧪
ការរកឃើញភាពមិនប្រក្រតីច្រើនតែជា "ម្ជុលក្នុងគំនរចំបើង" ដែលធ្វើឱ្យការវាយតម្លៃចម្លែក៖
-
ខ្សែកោង ROC អាចមើលទៅល្អមែនទែន នៅពេលដែលភាពវិជ្ជមានកម្រមាន។
-
ទស្សនៈនៃការរំលឹកឡើងវិញដោយភាពជាក់លាក់ច្រើនតែផ្តល់ព័ត៌មានច្រើនជាងសម្រាប់ការកំណត់ដែលមិនមានតុល្យភាព ពីព្រោះវាផ្តោតលើការអនុវត្តលើថ្នាក់វិជ្ជមាន។ [4]
-
ទាក់ទងនឹងប្រតិបត្តិការ អ្នកក៏ត្រូវការ ថវិកាជូនដំណឹង ៖ តើមនុស្សអាចរៀបចំការជូនដំណឹងបានប៉ុន្មានក្នុងមួយម៉ោងដោយមិនឈប់ខឹង? [4]
ការធ្វើតេស្តថយក្រោយឆ្លងកាត់បង្អួចរំកិលជួយអ្នកឱ្យចាប់យករបៀបបរាជ័យបុរាណ៖ "វាដំណើរការយ៉ាងស្រស់ស្អាត... លើការចែកចាយខែមុន។" [1]
ការបកស្រាយ និងមូលហេតុចម្បង៖ បង្ហាញការងាររបស់អ្នក 🪄
ការជូនដំណឹងដោយគ្មានការពន្យល់គឺដូចជាការទទួលបានកាតប៉ុស្តាល់អាថ៌កំបាំងមួយ។ មានប្រយោជន៍ ប៉ុន្តែគួរឱ្យខកចិត្ត។
ឧបករណ៍បកស្រាយអាចជួយបានដោយចង្អុលបង្ហាញថា តើលក្ខណៈពិសេសណាខ្លះដែលរួមចំណែកច្រើនបំផុត ដល់ពិន្ទុភាពមិនប្រក្រតី ឬដោយផ្តល់ការពន្យល់អំពីរចនាប័ទ្ម "អ្វីដែលត្រូវការផ្លាស់ប្តូរដើម្បីឱ្យវាមើលទៅធម្មតា?"។ Interpretable Machine Learning គឺជាមគ្គុទ្ទេសក៍ដ៏រឹងមាំ និងសំខាន់មួយចំពោះវិធីសាស្រ្តទូទៅ (រួមទាំងការបញ្ជាក់រចនាប័ទ្ម SHAP) និងដែនកំណត់របស់វា។ [5]
គោលដៅមិនមែនគ្រាន់តែជាការលួងលោមអ្នកពាក់ព័ន្ធនោះទេ - វាគឺជាការតម្រៀបលឿនជាងមុន និងឧប្បត្តិហេតុដដែលៗតិចជាងមុន។
ការដាក់ពង្រាយ ការរសាត់ និងរង្វិលជុំមតិប្រតិកម្ម 🚀
ម៉ូដែលមិនរស់នៅក្នុងស្លាយទេ ពួកគេរស់នៅក្នុងបំពង់បង្ហូរ។
រឿងរ៉ាវទូទៅមួយអំពី "ខែដំបូងក្នុងផលិតកម្ម"៖ ឧបករណ៍ចាប់សញ្ញាភាគច្រើនដាក់ទង់ជាតិលើការដាក់ពង្រាយ ការងារជាបាច់ និងទិន្នន័យដែលបាត់... ដែល នៅតែមានប្រយោជន៍ ព្រោះវាបង្ខំអ្នកឱ្យបំបែក "ឧប្បត្តិហេតុគុណភាពទិន្នន័យ" ពី "ភាពមិនប្រក្រតីនៃអាជីវកម្ម"។
ក្នុងការអនុវត្ត៖
-
តាមដានការរសាត់បាត់ និងហ្វឹកហាត់ឡើងវិញ/ក្រិតតាមខ្នាតឡើងវិញ នៅពេលដែលឥរិយាបថផ្លាស់ប្តូរ។ [1]
-
ការបញ្ចូលពិន្ទុកំណត់ហេតុ + កំណែគំរូ ដូច្នេះអ្នកអាចបង្កើតឡើងវិញនូវមូលហេតុដែលអ្វីមួយត្រូវបានបង្ហោះជាទំព័រ។ [5]
-
ចាប់យកមតិប្រតិកម្មរបស់មនុស្ស (ការជូនដំណឹងមានប្រយោជន៍ ធៀបនឹងការជូនដំណឹងដែលមានសំឡេងរំខាន) ដើម្បីកែសម្រួលកម្រិតកំណត់ និងផ្នែកនានាតាមពេលវេលា។ [4]
មុំសុវត្ថិភាព៖ IDS និងការវិភាគឥរិយាបថ 🛡️
ក្រុមសន្តិសុខច្រើនតែលាយបញ្ចូលគ្នានូវគំនិតមិនប្រក្រតីជាមួយនឹងការរកឃើញដែលមានមូលដ្ឋានលើច្បាប់៖ បន្ទាត់មូលដ្ឋានសម្រាប់ "ឥរិយាបថម៉ាស៊ីនធម្មតា" បូករួមទាំងហត្ថលេខា និងគោលការណ៍សម្រាប់គំរូអាក្រក់ដែលគេស្គាល់។ SP 800-94 (ចុងក្រោយ) របស់ NIST នៅតែជាក្របខ័ណ្ឌដែលត្រូវបានលើកឡើងយ៉ាងទូលំទូលាយសម្រាប់ការពិចារណាប្រព័ន្ធរកឃើញ និងការបង្ការការឈ្លានពាន។ វាក៏កត់សម្គាល់ផងដែរថាសេចក្តីព្រាងឆ្នាំ 2012 "Rev. 1" មិនដែលក្លាយជាចុងក្រោយទេ ហើយក្រោយមកត្រូវបានលុបចោល។ [3]
ការបកប្រែ៖ ប្រើ ML ដែលវាជួយបាន ប៉ុន្តែកុំបោះចោលច្បាប់គួរឱ្យធុញ - ពួកវាគួរឱ្យធុញព្រោះវាដំណើរការ។
តារាងប្រៀបធៀប៖ វិធីសាស្រ្តពេញនិយមដោយសង្ខេប 📊
| ឧបករណ៍ / វិធីសាស្រ្ត | ល្អបំផុតសម្រាប់ | ហេតុអ្វីបានជាវាដំណើរការ (ក្នុងការអនុវត្ត) |
|---|---|---|
| ពិន្ទុ z រឹងមាំ / កែប្រែ | រង្វាស់សាមញ្ញ មូលដ្ឋានរហ័ស | ការឆ្លងកាត់លើកដំបូងដ៏រឹងមាំ នៅពេលដែលអ្នកត្រូវការ "ល្អគ្រប់គ្រាន់" និងការជូនដំណឹងមិនពិតតិចជាងមុន។ [3] |
| ព្រៃឯកោ | តារាង, លក្ខណៈពិសេសចម្រុះ | ការអនុវត្តលំនាំដើមដ៏រឹងមាំ និងត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយក្នុងការអនុវត្ត។ [2] |
| SVM ថ្នាក់តែមួយ | តំបន់ "ធម្មតា" បង្រួម | ការរកឃើញភាពថ្មីថ្មោងដោយផ្អែកលើព្រំដែន; ការលៃតម្រូវមានសារៈសំខាន់ខ្លាំងណាស់។ [2] |
| កត្តា Outlier ក្នុងស្រុក | ធម្មតាដូចម៉ានីហ្វូល | ភាពផ្ទុយគ្នានៃដង់ស៊ីតេទល់នឹងអ្នកជិតខាងចាប់យកភាពចម្លែកក្នុងស្រុក។ [1] |
| កំហុសក្នុងការកសាងឡើងវិញ (ឧទាហរណ៍ រចនាប័ទ្មអ៊ិនកូដឌ័រដោយស្វ័យប្រវត្តិ) | លំនាំវិមាត្រខ្ពស់ | ហ្វឹកហាត់លើផ្លូវធម្មតា។ កំហុសក្នុងការកសាងឡើងវិញធំៗអាចបង្ហាញពីគម្លាត។ [1] |
កូដបន្លំ៖ ចាប់ផ្តើមជាមួយនឹងបន្ទាត់មូលដ្ឋានរឹងមាំ + វិធីសាស្រ្តដែលគួរឱ្យធុញដែលមិនមានការត្រួតពិនិត្យ បន្ទាប់មកបន្ថែមភាពស្មុគស្មាញតែកន្លែងដែលវាបង់ថ្លៃជួលប៉ុណ្ណោះ។
សៀវភៅណែនាំខ្នាតតូច៖ ពីសូន្យដល់ការជូនដំណឹង 🧭
-
សូមកំណត់ពាក្យ “ចម្លែក” ក្នុងន័យប្រតិបត្តិការ (ភាពយឺតយ៉ាវ ហានិភ័យនៃការក្លែងបន្លំ ការវាយប្រហារ CPU ហានិភ័យនៃសារពើភ័ណ្ឌ)។
-
ចាប់ផ្តើមជាមួយនឹងមូលដ្ឋាន (ស្ថិតិរឹងមាំ ឬកម្រិតដែលបានបែងចែក)។ [3]
-
ជ្រើសរើសម៉ូដែលដែលមិនបានត្រួតពិនិត្យមួយ ជាការឆ្លងកាត់លើកដំបូង (ព្រៃឯកោ / LOF / SVM ថ្នាក់តែមួយ)។ [2]
-
កំណត់កម្រិតជាមួយនឹងថវិកាដែលបានប្រុងប្រយ័ត្ន ហើយវាយតម្លៃដោយប្រើការគិតបែប PR ប្រសិនបើភាពវិជ្ជមានកម្រមាន។ [4]
-
បន្ថែមការពន្យល់ + ការកត់ត្រា ដើម្បីឱ្យការជូនដំណឹងនីមួយៗអាចបង្កើតឡើងវិញបាន និងអាចបំបាត់កំហុសបាន។ [5]
-
ការធ្វើតេស្តឡើងវិញ បញ្ជូន រៀន ក្រិតតាមខ្នាតឡើងវិញ - ការរសាត់បាត់គឺជារឿងធម្មតា។ [1]
អ្នកពិតជាអាចធ្វើបែបនេះបានក្នុងរយៈពេលមួយសប្តាហ៍… ដោយសន្មតថាត្រាពេលវេលារបស់អ្នកមិនត្រូវបានភ្ជាប់ជាមួយកាសែតស្អិត និងក្តីសង្ឃឹមនោះទេ។ 😅
កំណត់សម្គាល់ចុងក្រោយ - វែងពេក ខ្ញុំមិនបានអានវាទេ🧾
បញ្ញាសិប្បនិម្មិត (AI) រកឃើញភាពមិនប្រក្រតីដោយរៀនរូបភាពជាក់ស្តែងនៃ "ធម្មតា" ដាក់ពិន្ទុគម្លាត និងដាក់សញ្ញាសម្គាល់អ្វីដែលឆ្លងកាត់កម្រិតកំណត់។ ប្រព័ន្ធល្អបំផុតឈ្នះមិនមែនដោយការភ្លឺចែងចាំងនោះទេ ប៉ុន្តែដោយការក្រិត តាមខ្នាត ៖ បន្ទាត់គោលដែលបានបែងចែកជាផ្នែកៗ ថវិកាជូនដំណឹង លទ្ធផលដែលអាចបកស្រាយបាន និងរង្វិលជុំមតិប្រតិកម្មដែលប្រែក្លាយសំឡេងរោទិ៍ដែលមានសំឡេងរំខានទៅជាសញ្ញាដែលអាចទុកចិត្តបាន។ [1]
ឯកសារយោង
-
Pimentel et al. (2014) - ការពិនិត្យឡើងវិញអំពីការរកឃើញភាពថ្មីថ្មោង (PDF, សាកលវិទ្យាល័យ Oxford) អានបន្ថែម
-
ឯកសារ scikit-learn - ការរកឃើញភាពថ្មីថ្មោង និងភាពមិនប្រក្រតី អានបន្ថែម
-
សៀវភៅណែនាំអេឡិចត្រូនិច NIST/SEMATECH - ការរកឃើញចំណុចខ្សោយ អានបន្ថែម និង NIST CSRC - SP 800-94 (ចុងក្រោយ): ការណែនាំអំពីប្រព័ន្ធរកឃើញ និងការពារការឈ្លានពាន (IDPS) អានបន្ថែម
-
Saito & Rehmsmeier (2015) - គំនូសតាង Precision-Recall មានព័ត៌មានច្រើនជាងគំនូសតាង ROC នៅពេលវាយតម្លៃឧបករណ៍ចាត់ថ្នាក់ប្រព័ន្ធគោលពីរលើសំណុំទិន្នន័យមិនមានតុល្យភាព (PLOS ONE) អានបន្ថែម
-
Molnar - ការរៀនម៉ាស៊ីនដែលអាចបកស្រាយបាន (សៀវភៅគេហទំព័រ) អានបន្ថែម