តើ AI រៀនយ៉ាងដូចម្តេច? ការណែនាំនេះស្រាយចម្ងល់អំពីគំនិតធំៗជាភាសាសាមញ្ញ - ជាមួយនឹងឧទាហរណ៍ ការបង្វែរតូចៗ និងពាក្យប្រៀបធៀបមិនល្អឥតខ្ចោះមួយចំនួនដែលនៅតែជួយបាន។ ចូរយើងចាប់ផ្តើមវា។ 🙂
អត្ថបទដែលអ្នកប្រហែលជាចូលចិត្តអានបន្ទាប់ពីនេះ៖
🔗 តើ AI ព្យាករណ៍ជាអ្វី?
របៀបដែលគំរូព្យាករណ៍ព្យាករណ៍លទ្ធផលដោយប្រើទិន្នន័យប្រវត្តិសាស្ត្រ និងពេលវេលាជាក់ស្តែង។.
🔗 តើឧស្សាហកម្មអ្វីខ្លះដែល AI នឹងរំខាន
វិស័យនានាទំនងជាត្រូវបានផ្លាស់ប្តូរដោយប្រព័ន្ធស្វ័យប្រវត្តិកម្ម ការវិភាគ និងភ្នាក់ងារ។.
🔗 តើ GPT តំណាងឱ្យអ្វី
ការពន្យល់ច្បាស់លាស់អំពីអក្សរកាត់ GPT និងប្រភពដើម។.
🔗 តើជំនាញ AI ជាអ្វី?
សមត្ថភាពស្នូលសម្រាប់ការកសាង ការដាក់ពង្រាយ និងគ្រប់គ្រងប្រព័ន្ធ AI ។
ដូច្នេះ តើវាធ្វើវាដោយរបៀបណា? ✅
នៅពេលដែលមនុស្សសួរថា តើ AI រៀនដោយរបៀបណា? ជាធម្មតាពួកគេចង់មានន័យថា តើគំរូមានប្រយោជន៍យ៉ាងដូចម្តេច ជំនួសឱ្យប្រដាប់ក្មេងលេងគណិតវិទ្យាដ៏ប្រណិត។ ចម្លើយគឺជារូបមន្តមួយ៖
-
គោលបំណងច្បាស់លាស់ - អនុគមន៍បាត់បង់ដែលកំណត់អត្ថន័យនៃពាក្យ "ល្អ"។ [1]
-
ទិន្នន័យដែលមានគុណភាព - មានភាពចម្រុះ ស្អាត និងពាក់ព័ន្ធ។ បរិមាណជួយបានច្រើន; ភាពចម្រុះជួយបានច្រើន។ [1]
-
ការបង្កើនប្រសិទ្ធភាពដែលមានស្ថេរភាព - ការចុះជម្រាលជាមួយនឹងល្បិចដើម្បីជៀសវាងការរង្គើចេញពីច្រាំងថ្មចោទ។ [1], [2]
-
ការធ្វើឱ្យមានលក្ខណៈទូទៅ - ភាពជោគជ័យលើទិន្នន័យថ្មី មិនមែនគ្រាន់តែសំណុំបណ្តុះបណ្តាលនោះទេ។ [1]
-
រង្វិលជុំមតិប្រតិកម្ម - ការវាយតម្លៃ ការវិភាគកំហុស និងការធ្វើម្តងទៀត។ [2], [3]
-
សុវត្ថិភាព និងភាពជឿជាក់ - របាំងការពារ ការធ្វើតេស្ត និងឯកសារ ដូច្នេះវាមិនមែនជាភាពវឹកវរទេ។ [4]
សម្រាប់មូលដ្ឋានគ្រឹះដែលងាយស្រួលយល់ អត្ថបទសិក្សាស៊ីជម្រៅបែបបុរាណ កំណត់ចំណាំវគ្គសិក្សាដែលងាយស្រួលមើលឃើញ និងវគ្គសិក្សារហ័សដែលអនុវត្តជាក់ស្តែងគ្របដណ្តប់លើចំណុចសំខាន់ៗដោយមិនចាំបាច់លង់លក់ក្នុងនិមិត្តសញ្ញាឡើយ។ [1]–[3]
តើ AI រៀនយ៉ាងដូចម្តេច? ចម្លើយខ្លីជាភាសាអង់គ្លេសសាមញ្ញ ✍️
គំរូ AI ចាប់ផ្តើមជាមួយតម្លៃប៉ារ៉ាម៉ែត្រចៃដន្យ។ វាធ្វើការព្យាករណ៍។ អ្នករកពិន្ទុការព្យាករណ៍នោះជាមួយនឹង ការខាតបង់ ។ បន្ទាប់មកអ្នករុញប៉ារ៉ាម៉ែត្រទាំងនោះដើម្បីកាត់បន្ថយការខាតបង់ដោយប្រើ ជម្រាល ។ ធ្វើរង្វិលជុំនេះម្តងទៀតនៅទូទាំងឧទាហរណ៍ជាច្រើនរហូតដល់គំរូឈប់កែលម្អ (ឬអ្នកអស់អាហារសម្រន់)។ នោះគឺជារង្វិលជុំហ្វឹកហាត់ក្នុងមួយដង្ហើម។ [1], [2]
ប្រសិនបើអ្នកចង់បានភាពជាក់លាក់បន្ថែមទៀត សូមមើលផ្នែកស្តីពីការចុះជម្រាល និងការសាយភាយត្រឡប់ក្រោយខាងក្រោម។ សម្រាប់ប្រវត្តិរហ័ស និងងាយយល់ ការបង្រៀនខ្លីៗ និងមន្ទីរពិសោធន៍អាចរកបានយ៉ាងទូលំទូលាយ។ [2], [3]
មូលដ្ឋានគ្រឹះ៖ ទិន្នន័យ គោលបំណង ការបង្កើនប្រសិទ្ធភាព 🧩
-
ទិន្នន័យ ៖ ធាតុចូល (x) និងគោលដៅ (y)។ ទិន្នន័យកាន់តែទូលំទូលាយ និងស្អាតជាងមុន ឱកាសរបស់អ្នកក្នុងការធ្វើឱ្យមានលក្ខណៈទូទៅកាន់តែល្អ។ ការរៀបចំទិន្នន័យមិនមែនជារឿងអស្ចារ្យទេ ប៉ុន្តែវាជាវីរបុរសដែលមិនសូវមានអ្នកស្គាល់។ [1]
-
គំរូ ៖ អនុគមន៍ (f_\theta(x)) ដែលមានប៉ារ៉ាម៉ែត្រ (\theta)។ បណ្តាញសរសៃប្រសាទគឺជាជង់នៃឯកតាសាមញ្ញៗ ដែលរួមបញ្ចូលគ្នាតាមវិធីស្មុគស្មាញ—ឥដ្ឋ Lego ប៉ុន្តែទន់ជាង។ [1]
-
គោលបំណង ៖ ការខាតបង់ (L(f_\theta(x), y)) ដែលវាស់ស្ទង់កំហុស។ ឧទាហរណ៍៖ កំហុសមធ្យមការ៉េ (តំរែតំរង់) និង cross-entropy (ចំណាត់ថ្នាក់)។ [1]
-
ការបង្កើនប្រសិទ្ធភាព ៖ ប្រើការចុះជម្រាល (ស្តូកាស្ទិក) ដើម្បីធ្វើបច្ចុប្បន្នភាពប៉ារ៉ាម៉ែត្រ៖ (\theta \leftarrow \theta - \eta \nabla_\theta L)។ អត្រារៀន (\eta): ធំពេក ហើយអ្នកលោតចុះមក។ តូចពេក ហើយអ្នកងងុយគេងជារៀងរហូត។ [2]
សម្រាប់ការណែនាំអំពីមុខងារបាត់បង់ និងការបង្កើនប្រសិទ្ធភាព កំណត់ចំណាំបុរាណអំពីល្បិចហ្វឹកហាត់ និងចំណុចខ្វះខាតគឺជាការអានរំលងដ៏ល្អ។ [2]
ការរៀនសូត្រដែលមានការត្រួតពិនិត្យ៖ រៀនពីឧទាហរណ៍ដែលមានស្លាក 🎯
គំនិត ៖ បង្ហាញគូគំរូនៃការបញ្ចូល និងចម្លើយត្រឹមត្រូវ។ គំរូរៀនការគូសផែនទី (x \rightarrow y)។
-
ភារកិច្ចទូទៅ ៖ ការចាត់ថ្នាក់រូបភាព ការវិភាគអារម្មណ៍ ការទស្សន៍ទាយតាមតារាង ការស្គាល់ការនិយាយ។
-
ការខាតបង់ធម្មតា ៖ ឆ្លងកាត់អង់ត្រូពីសម្រាប់ការចាត់ថ្នាក់ កំហុសមធ្យមការ៉េសម្រាប់ការតំរែតំរង់។ [1]
-
គុណវិបត្តិ ៖ សំឡេងរំខានលើស្លាក ភាពមិនស្មើគ្នានៃថ្នាក់ ការលេចធ្លាយទិន្នន័យ។
-
ការជួសជុល ៖ ការយកគំរូតាមស្រទាប់ ការខាតបង់ដ៏រឹងមាំ ការធ្វើឱ្យមានលក្ខណៈធម្មតា និងការប្រមូលទិន្នន័យចម្រុះជាងមុន។ [1], [2]
ដោយផ្អែកលើស្តង់ដារ និងការអនុវត្តផលិតកម្មរាប់ទសវត្សរ៍ ការរៀនសូត្រដែលមានការត្រួតពិនិត្យនៅតែជាកម្លាំងចលករ ពីព្រោះលទ្ធផលអាចទស្សន៍ទាយបាន ហើយរង្វាស់គឺសាមញ្ញ។ [1], [3]
ការរៀនសូត្រដោយមិនមានការត្រួតពិនិត្យ និងការរៀនសូត្រដោយខ្លួនឯង៖ រៀនអំពីរចនាសម្ព័ន្ធនៃទិន្នន័យ 🔍
ដែលមិនមានការត្រួតពិនិត្យ រៀនលំនាំដោយគ្មានស្លាក។
-
ការដាក់ជាក្រុម ៖ ដាក់ជាក្រុមចំណុចស្រដៀងគ្នា - មធ្យមភាគ k គឺសាមញ្ញ និងមានប្រយោជន៍គួរឱ្យភ្ញាក់ផ្អើល។
-
ការកាត់បន្ថយវិមាត្រ ៖ បង្ហាប់ទិន្នន័យទៅទិសដៅសំខាន់ៗ—PCA គឺជាឧបករណ៍ច្រកផ្លូវ។
-
ការធ្វើគំរូដង់ស៊ីតេ/បង្កើត ៖ ស្វែងយល់ពីការចែកចាយទិន្នន័យដោយខ្លួនឯង។ [1]
ការត្រួតពិនិត្យដោយខ្លួនឯង គឺជាម៉ាស៊ីនទំនើប៖ គំរូបង្កើតការត្រួតពិនិត្យផ្ទាល់ខ្លួនរបស់ពួកគេ (ការទស្សន៍ទាយបិទបាំង ការរៀនផ្ទុយគ្នា) ដែលអនុញ្ញាតឱ្យអ្នកហ្វឹកហាត់ជាមុនលើមហាសមុទ្រនៃទិន្នន័យដែលមិនមានស្លាក និងកែសម្រួលនៅពេលក្រោយ។ [1]
ការរៀនសូត្របែបពង្រឹងសមត្ថភាព៖ រៀនដោយការអនុវត្ត និងការទទួលបានមតិកែលម្អ 🕹️
ភ្នាក់ងារ ម្នាក់ ធ្វើអន្តរកម្មជាមួយ បរិស្ថាន ទទួលបាន រង្វាន់ និងរៀន គោលការណ៍ ដែលបង្កើនរង្វាន់រយៈពេលវែងឲ្យបានអតិបរមា។
-
ធាតុស្នូល ៖ ស្ថានភាព សកម្មភាព រង្វាន់ គោលនយោបាយ តម្លៃ មុខងារ។
-
ក្បួនដោះស្រាយ ៖ ការរៀនសូត្រ Q, ជម្រាលគោលនយោបាយ, អ្នកដើរតួ-អ្នករិះគន់។
-
ការរុករក ទល់នឹង ការកេងប្រវ័ញ្ច ៖ សាកល្បងរបស់ថ្មីៗ ឬប្រើប្រាស់អ្វីដែលមានប្រសិទ្ធភាពឡើងវិញ។
-
ការផ្ទេរឥណទាន ៖ តើសកម្មភាពណាដែលបណ្តាលឱ្យមានលទ្ធផលអ្វី?
មតិប្រតិកម្មរបស់មនុស្សអាចណែនាំការបណ្តុះបណ្តាលនៅពេលដែលរង្វាន់មានភាពរញ៉េរញ៉ៃ - ចំណាត់ថ្នាក់ ឬចំណូលចិត្តជួយបង្កើតឥរិយាបថដោយមិនចាំបាច់សរសេរកូដដោយដៃនូវរង្វាន់ដ៏ល្អឥតខ្ចោះនោះទេ។ [5]
ការរៀនសូត្រស៊ីជម្រៅ ការទ្រទ្រង់ពីក្រោយ និងការចុះជម្រាល - បេះដូងដែលកំពុងលោតញាប់ 🫀
បណ្តាញសរសៃប្រសាទគឺជាសមាសធាតុនៃអនុគមន៍សាមញ្ញៗ។ ដើម្បីរៀន ពួកវាពឹងផ្អែកលើ ការសាយភាយត្រឡប់មកវិញ ៖
-
បញ្ជូនបន្ត ៖ គណនាការព្យាករណ៍ពីធាតុចូល។
-
ការខាតបង់ ៖ កំហុសវាស់វែងរវាងការព្យាករណ៍ និងគោលដៅ។
-
ការឆ្លងកាត់ថយក្រោយ ៖ អនុវត្តច្បាប់ខ្សែសង្វាក់ដើម្បីគណនាជម្រាលនៃការខាតបង់លើប៉ារ៉ាម៉ែត្រនីមួយៗ។
-
ការអាប់ដេត ៖ ជំរុញប៉ារ៉ាម៉ែត្រប្រឆាំងនឹងជម្រាលដោយប្រើឧបករណ៍បង្កើនប្រសិទ្ធភាព។
វ៉ារ្យ៉ង់ដូចជា momentum, RMSProp និង Adam ធ្វើឱ្យការហ្វឹកហាត់មិនសូវមានលក្ខណៈឆេវឆាវ។ វិធីសាស្ត្រធ្វើឱ្យមានលក្ខណៈធម្មតាដូចជា ការឈប់ហ្វឹកហាត់ ការ សម្រកទម្ងន់ និង ការឈប់ដំបូង ជួយគំរូឱ្យធ្វើឱ្យមានលក្ខណៈទូទៅជំនួសឱ្យការទន្ទេញចាំ។ [1], [2]
Transformers និងការយកចិត្តទុកដាក់៖ ហេតុអ្វីបានជាម៉ូដែលទំនើបមានអារម្មណ៍ឆ្លាតវៃ 🧠✨
ឧបករណ៍បំលែងបានជំនួសការរៀបចំដដែលៗជាច្រើននៅក្នុងភាសា និងចក្ខុវិស័យ។ ល្បិចសំខាន់គឺ ការយកចិត្តទុកដាក់ដោយខ្លួនឯង ដែលអនុញ្ញាតឱ្យគំរូថ្លឹងថ្លែងផ្នែកផ្សេងៗគ្នានៃការបញ្ចូលរបស់វាអាស្រ័យលើបរិបទ។ ការអ៊ិនកូដទីតាំងដោះស្រាយលំដាប់ ហើយ ការយកចិត្តទុកដាក់ច្រើនក្បាល អនុញ្ញាតឱ្យគំរូផ្តោតលើទំនាក់ទំនងផ្សេងៗគ្នាក្នុងពេលតែមួយ។ ការធ្វើមាត្រដ្ឋាន - ទិន្នន័យចម្រុះជាងមុន ប៉ារ៉ាម៉ែត្រកាន់តែច្រើន ការហ្វឹកហាត់យូរជាងមុន - ជារឿយៗជួយ ដោយកាត់បន្ថយផលចំណេញ និងការកើនឡើងនៃថ្លៃដើម។ [1], [2]
ការធ្វើឱ្យទូទៅ ការធ្វើឱ្យសមស្របពេក និងរបាំលំអៀង-វ៉ារ្យង់ 🩰
តារាម៉ូដែលអាចពូកែខាងហ្វឹកហាត់ ហើយនៅតែបរាជ័យក្នុងពិភពពិត។.
-
ការសមលើសកម្រិត ៖ ទន្ទេញសំឡេងរំខាន។ កំហុសក្នុងការហ្វឹកហាត់ថយចុះ កំហុសក្នុងការសាកល្បងឡើងលើ។
-
មិនសមល្មម ៖ សាមញ្ញពេក; ខកខានសញ្ញា។
-
ការសម្របសម្រួលភាពលំអៀង-ភាពប្រែប្រួល ៖ ភាពស្មុគស្មាញកាត់បន្ថយភាពលំអៀង ប៉ុន្តែអាចបង្កើនភាពប្រែប្រួល។
របៀបធ្វើឱ្យទូទៅកាន់តែប្រសើរឡើង:
-
ទិន្នន័យចម្រុះជាងមុន - ប្រភព ដែន និងករណីគែមផ្សេងៗគ្នា។.
-
ការធ្វើឱ្យប្រក្រតីកម្ម - ការបោះបង់ចោលការសិក្សា ការស្រកទម្ងន់ ការបង្កើនទិន្នន័យ។.
-
ការផ្ទៀងផ្ទាត់ត្រឹមត្រូវ - សំណុំតេស្តស្អាត ការផ្ទៀងផ្ទាត់ឆ្លងសម្រាប់ទិន្នន័យតូចៗ។.
-
ការតាមដានការរសាត់បាត់ - ការចែកចាយទិន្នន័យរបស់អ្នកនឹងផ្លាស់ប្តូរតាមពេលវេលា។.
ការអនុវត្តដែលយល់ដឹងពីហានិភ័យកំណត់សកម្មភាពទាំងនេះជាសកម្មភាពវដ្តជីវិត - ការគ្រប់គ្រង ការគូសផែនទី ការវាស់វែង និងការគ្រប់គ្រង - មិនមែនជាបញ្ជីត្រួតពិនិត្យម្តងម្កាលនោះទេ។ [4]
ម៉ែត្រិចដែលសំខាន់៖ របៀបដែលយើងដឹងថាការរៀនសូត្របានកើតឡើង 📈
-
ចំណាត់ថ្នាក់ ៖ ភាពត្រឹមត្រូវ, ភាពជាក់លាក់, ការចងចាំ, F1, ROC AUC។ ទិន្នន័យមិនមានតុល្យភាពទាមទារខ្សែកោងភាពជាក់លាក់-ការចងចាំ។ [3]
-
តំរែតំរង់ ៖ MSE, MAE, (R^2)។ [1]
-
ចំណាត់ថ្នាក់/ការទាញយក ៖ MAP, NDCG, recall@K. [1]
-
គំរូបង្កើត ៖ ភាពច្របូកច្របល់ (ភាសា) BLEU/ROUGE/CIDer (អត្ថបទ) ពិន្ទុផ្អែកលើ CLIP (ពហុម៉ូឌុល) និងការវាយតម្លៃដ៏សំខាន់បំផុតរបស់មនុស្ស។ [1], [3]
ជ្រើសរើសម៉ែត្រិចដែលស្របនឹងផលប៉ះពាល់របស់អ្នកប្រើប្រាស់។ ការកើនឡើងតិចតួចនៃភាពត្រឹមត្រូវអាចមិនពាក់ព័ន្ធទេ ប្រសិនបើលទ្ធផលវិជ្ជមានក្លែងក្លាយជាតម្លៃពិតប្រាកដ។ [3]
លំហូរការងារបណ្តុះបណ្តាលនៅក្នុងពិភពពិត៖ គំរូសាមញ្ញមួយ 🛠️
-
កំណត់បញ្ហា - កំណត់ធាតុចូល លទ្ធផល ការរឹតបន្តឹង និងលក្ខណៈវិនិច្ឆ័យជោគជ័យ។
-
បំពង់ទិន្នន័យ - ការប្រមូល ការដាក់ស្លាក ការសម្អាត ការបំបែក ការបង្កើន។
-
បន្ទាត់គោល - ចាប់ផ្តើមសាមញ្ញ; បន្ទាត់គោលលីនេអ៊ែរ ឬដើមឈើមានការប្រកួតប្រជែងគួរឱ្យភ្ញាក់ផ្អើល។
-
ការធ្វើគំរូ - សាកល្បងគ្រួសារមួយចំនួន៖ ដើមឈើដែលជំរុញដោយជម្រាល (តារាង), CNNs (រូបភាព), Transformers (អត្ថបទ)។
-
ការបណ្តុះបណ្តាល - កាលវិភាគ យុទ្ធសាស្ត្រអត្រានៃការរៀនសូត្រ ចំណុចត្រួតពិនិត្យ ភាពជាក់លាក់ចម្រុះប្រសិនបើចាំបាច់។
-
ការវាយតម្លៃ - ការកាត់ចេញ និងការវិភាគកំហុស។ សូមក្រឡេកមើលកំហុស មិនមែនគ្រាន់តែមធ្យមភាគនោះទេ។
-
ការដាក់ពង្រាយ - បំពង់បង្ហូរទិន្នន័យសន្និដ្ឋាន ការត្រួតពិនិត្យ ការកត់ត្រា ផែនការរំកិលថយក្រោយ។
-
ធ្វើឡើងវិញ - ទិន្នន័យប្រសើរឡើង ការលៃតម្រូវល្អប្រសើរ ឬការកែប្រែស្ថាបត្យកម្ម។
ករណីតូច ៖ គម្រោងចាត់ថ្នាក់តាមអ៊ីមែលបានចាប់ផ្តើមជាមួយនឹងបន្ទាត់គោលលីនេអ៊ែរសាមញ្ញមួយ បន្ទាប់មកបានលៃតម្រូវឧបករណ៍បំលែងដែលបានហ្វឹកហាត់ជាមុន។ ជ័យជម្នះដ៏ធំបំផុតមិនមែនជាគំរូនោះទេ - វាគឺជាការរឹតបន្តឹងចំណាត់ថ្នាក់ស្លាក និងបន្ថែមប្រភេទ "គែម" ដែលមិនសូវតំណាង។ នៅពេលដែលពួកវាត្រូវបានគ្របដណ្តប់ ការផ្ទៀងផ្ទាត់ F1 ទីបំផុតបានតាមដានការអនុវត្តក្នុងពិភពពិត។ (អនាគតរបស់អ្នក៖ ដឹងគុណយ៉ាងខ្លាំង។)
គុណភាពទិន្នន័យ ការដាក់ស្លាក និងសិល្បៈដ៏ប៉ិនប្រសប់នៃការមិនកុហកខ្លួនឯង 🧼
សំរាមចូលហើយ ស្ដាយក្រោយ។ គោលការណ៍ណែនាំសម្រាប់ការដាក់ស្លាកគួរតែស៊ីសង្វាក់គ្នា អាចវាស់វែងបាន និងពិនិត្យឡើងវិញ។ ការព្រមព្រៀងគ្នារវាងអ្នកអត្ថាធិប្បាយគឺមានសារៈសំខាន់។.
-
សរសេរតារាងវាយតម្លៃជាមួយឧទាហរណ៍ ករណីជ្រុង និងចំណុចបំបែកពិន្ទុ។.
-
សំណុំទិន្នន័យសវនកម្មសម្រាប់ឯកសារស្ទួន និងឯកសារស្ទើរតែស្ទួន។.
-
តាមដានប្រភពដើម - កន្លែងដែលឧទាហរណ៍នីមួយៗមកពីណា និងមូលហេតុដែលវាត្រូវបានរួមបញ្ចូល។.
-
វាស់ស្ទង់ការគ្របដណ្តប់ទិន្នន័យទល់នឹងសេណារីយ៉ូអ្នកប្រើប្រាស់ពិតប្រាកដ មិនមែនគ្រាន់តែជាស្តង់ដារដ៏ស្អាតស្អំនោះទេ។.
ទាំងនេះសមស្របយ៉ាងល្អឥតខ្ចោះនៅក្នុងក្របខ័ណ្ឌធានា និងអភិបាលកិច្ចទូលំទូលាយ ដែលអ្នកពិតជាអាចធ្វើប្រតិបត្តិការបាន។ [4]
ការរៀនសូត្រផ្ទេរ ការលៃតម្រូវ និងការភ្ជាប់ - ប្រើឡើងវិញនូវការលើកធ្ងន់ៗ ♻️
ម៉ូដែលដែលបានទទួលការបណ្តុះបណ្តាលជាមុនរៀនពីការតំណាងទូទៅ។ ការលៃតម្រូវល្អិតល្អន់សម្របពួកវាទៅនឹងភារកិច្ចរបស់អ្នកជាមួយនឹងទិន្នន័យតិចជាងមុន។.
-
ការស្រង់ចេញលក្ខណៈពិសេស ៖ បង្កកឆ្អឹងខ្នង ហ្វឹកហាត់ក្បាលតូចមួយ។
-
ការលៃតម្រូវពេញលេញ ៖ ធ្វើបច្ចុប្បន្នភាពប៉ារ៉ាម៉ែត្រទាំងអស់សម្រាប់សមត្ថភាពអតិបរមា។
-
វិធីសាស្ត្រដែលមានប្រសិទ្ធភាពប៉ារ៉ាម៉ែត្រ ៖ អាដាប់ទ័រ ការអាប់ដេតកម្រិតទាបបែប LoRA ល្អនៅពេលដែលការគណនាមានភាពតឹងតែង។
-
ការសម្របខ្លួនទៅនឹងដែន ៖ តម្រឹមការបង្កប់ឆ្លងកាត់ដែន; ការផ្លាស់ប្តូរតិចតួច ផលចំណេញធំ។ [1], [2]
គំរូនៃការប្រើប្រាស់ឡើងវិញនេះគឺជាមូលហេតុដែលគម្រោងទំនើបៗអាចដំណើរការបានលឿនដោយមិនចាំបាច់មានថវិកាច្រើនហួសហេតុ។.
សុវត្ថិភាព ភាពជឿជាក់ និងការតម្រឹម - ប៊ីតដែលមិនមែនជាជម្រើស 🧯
ការរៀនសូត្រមិនមែនគ្រាន់តែជាភាពត្រឹមត្រូវនោះទេ។ អ្នកក៏ចង់បានគំរូដែលរឹងមាំ យុត្តិធម៌ និងស្របតាមការប្រើប្រាស់ដែលបានគ្រោងទុកផងដែរ។.
-
ភាពរឹងមាំផ្ទុយគ្នា ៖ ការរំខានតិចតួចអាចបញ្ឆោតគំរូ។
-
ភាពលំអៀង និងភាពយុត្តិធម៌ ៖ វាស់ស្ទង់ការអនុវត្តក្រុមរង មិនមែនគ្រាន់តែមធ្យមភាគសរុបនោះទេ។
-
ការបកស្រាយ ៖ ការបញ្ជាក់លក្ខណៈពិសេស និងការស៊ើបអង្កេតជួយអ្នកឱ្យយល់ ពីមូលហេតុ ។
-
មនុស្សនៅក្នុងរង្វិលជុំ ៖ ផ្លូវនៃការកើនឡើងសម្រាប់ការសម្រេចចិត្តមិនច្បាស់លាស់ ឬមានផលប៉ះពាល់ខ្ពស់។ [4], [5]
ការរៀនសូត្រដោយផ្អែកលើចំណង់ចំណូលចិត្តគឺជាវិធីជាក់ស្តែងមួយដើម្បីរួមបញ្ចូលការវិនិច្ឆ័យរបស់មនុស្សនៅពេលដែលគោលបំណងមានភាពមិនច្បាស់លាស់។ [5]
សំណួរដែលសួរញឹកញាប់ក្នុងរយៈពេលមួយនាទី - ភ្លើងឆេះយ៉ាងលឿន ⚡
-
ដូច្នេះ តាមពិតទៅ តើ AI រៀនដោយរបៀបណា? តាមរយៈការបង្កើនប្រសិទ្ធភាពម្តងហើយម្តងទៀតប្រឆាំងនឹងការខាតបង់ ជាមួយនឹងជម្រាលដែលណែនាំប៉ារ៉ាម៉ែត្រឆ្ពោះទៅរកការព្យាករណ៍កាន់តែប្រសើរ។ [1], [2]
-
តើទិន្នន័យច្រើនតែងតែជួយទេ? ជាធម្មតា រហូតដល់ផលចំណេញថយចុះ។ ភាពចម្រុះច្រើនតែល្អជាងបរិមាណឆៅ។ [1]
-
ចុះបើស្លាកមានភាពរញ៉េរញ៉ៃ? ប្រើវិធីសាស្ត្រដែលមានសំឡេងរំខាន ការវាយតម្លៃកាន់តែប្រសើរ និងពិចារណាអំពីការហ្វឹកហ្វឺនជាមុនដែលមានការត្រួតពិនិត្យដោយខ្លួនឯង។ [1]
-
ហេតុអ្វីបានជាឧបករណ៍បំលែងអគ្គិសនីមានឥទ្ធិពល? ការយកចិត្តទុកដាក់ធ្វើមាត្រដ្ឋានបានល្អ និងចាប់យកភាពអាស្រ័យរយៈពេលវែង។ ឧបករណ៍មានភាពចាស់ទុំ។ [1], [2]
-
តើខ្ញុំដឹងដោយរបៀបណាថាខ្ញុំបានបញ្ចប់ការបណ្តុះបណ្តាល? ការបាត់បង់សុពលភាពថយចុះ រង្វាស់មានស្ថេរភាព ហើយទិន្នន័យថ្មីមានដំណើរការដូចការរំពឹងទុក - បន្ទាប់មកតាមដានការរសាត់បាត់។ [3], [4]
តារាងប្រៀបធៀប - ឧបករណ៍ដែលអ្នកពិតជាអាចប្រើប្រាស់បានសព្វថ្ងៃនេះ 🧰
ចេតនាចម្លែកបន្តិច។ តម្លៃគឺសម្រាប់បណ្ណាល័យស្នូល - ជាក់ស្តែង ការបណ្តុះបណ្តាលទ្រង់ទ្រាយធំមានថ្លៃដើមហេដ្ឋារចនាសម្ព័ន្ធ។.
| ឧបករណ៍ | ល្អបំផុតសម្រាប់ | តម្លៃ | ហេតុអ្វីបានជាវាដំណើរការបានល្អ |
|---|---|---|---|
| PyTorch | អ្នកស្រាវជ្រាវ អ្នកសាងសង់ | ឥតគិតថ្លៃ - បើកចំហ src | ក្រាហ្វថាមវន្ត ប្រព័ន្ធអេកូឡូស៊ីដ៏រឹងមាំ ការបង្រៀនដ៏អស្ចារ្យ។. |
| TensorFlow | ក្រុមផលិតកម្ម | ឥតគិតថ្លៃ - បើកចំហ src | ការបម្រើមនុស្សពេញវ័យ TF Lite សម្រាប់ទូរស័ព្ទចល័ត; សហគមន៍ធំ។. |
| រៀនដោយប្រើភាសាស្គីគីត | ទិន្នន័យតារាង, មូលដ្ឋាន | ឥតគិតថ្លៃ | API ស្អាត លឿនក្នុងការធ្វើម្តងទៀត ឯកសារល្អ។. |
| កេរ៉ាស | គំរូដើមរហ័ស | ឥតគិតថ្លៃ | API កម្រិតខ្ពស់លើ TF ស្រទាប់ដែលអាចអានបាន។. |
| ជេអ៊ិច | អ្នកប្រើប្រាស់ថាមពល, ការស្រាវជ្រាវ | ឥតគិតថ្លៃ | វ៉ិចទ័រស្វ័យប្រវត្តិ, ល្បឿន XLA, អារម្មណ៍គណិតវិទ្យាឆើតឆាយ។. |
| អ្នកប្រែរូបមុខឱប | NLP, ចក្ខុវិស័យ, សំឡេង | ឥតគិតថ្លៃ | ម៉ូដែលដែលបានហ្វឹកហាត់ជាមុន ការលៃតម្រូវដ៏សាមញ្ញ និងមជ្ឈមណ្ឌលដ៏ល្អ។. |
| ផ្លេកបន្ទោរ | លំហូរការងារបណ្តុះបណ្តាល | ស្នូលសេរី | រចនាសម្ព័ន្ធ, ការកត់ត្រា, ថ្មច្រើន GPU រួមបញ្ចូល។. |
| XGBoost | តារាងប្រកួតប្រជែង | ឥតគិតថ្លៃ | មូលដ្ឋានរឹងមាំ ជារឿយៗឈ្នះលើទិន្នន័យដែលមានរចនាសម្ព័ន្ធ។. |
| ទម្ងន់ និងភាពលំអៀង | ការតាមដានការពិសោធន៍ | កម្រិតឥតគិតថ្លៃ | សមត្ថភាពផលិតឡើងវិញ ប្រៀបធៀបដំណើរការ រង្វិលជុំរៀនលឿនជាងមុន។. |
ឯកសារដែលមានសិទ្ធិអំណាចដើម្បីចាប់ផ្តើមជាមួយ៖ PyTorch, TensorFlow និងមគ្គុទ្ទេសក៍អ្នកប្រើប្រាស់ scikit-learn ដ៏សាមញ្ញ។ (ជ្រើសរើសមួយ បង្កើតអ្វីតូច ហើយធ្វើវាម្តងហើយម្តងទៀត)។
ស្វែងយល់ឲ្យស៊ីជម្រៅ៖ គន្លឹះជាក់ស្តែងដែលជួយសន្សំសំចៃពេលវេលារបស់អ្នក 🧭
-
កាលវិភាគអត្រាសិក្សា ៖ ការរលួយកូស៊ីនុស ឬវដ្តមួយអាចធ្វើឱ្យការបណ្តុះបណ្តាលមានស្ថេរភាព។
-
ទំហំបាច់ ៖ ធំជាងមិនតែងតែល្អជាងនោះទេ - មើលម៉ែត្រផ្ទៀងផ្ទាត់ មិនមែនគ្រាន់តែបរិមាណផលិតកម្មទេ។
-
ទម្ងន់ init ៖ លំនាំដើមទំនើបគឺល្អ; ប្រសិនបើការហ្វឹកហាត់ជាប់គាំង សូមពិនិត្យមើលការចាប់ផ្តើមឡើងវិញ ឬធ្វើឱ្យស្រទាប់ដំបូងមានលក្ខណៈធម្មតា។
-
ការធ្វើឱ្យមានលក្ខណៈធម្មតា ៖ បទដ្ឋានបាច់ ឬបទដ្ឋានស្រទាប់អាចធ្វើឱ្យការបង្កើនប្រសិទ្ធភាពរលូនយ៉ាងខ្លាំង។
-
ការបង្កើនទិន្នន័យ ៖ ត្រឡប់/ច្រឹប/ញ័រពណ៌សម្រាប់រូបភាព; ការបិទបាំង/ការសាប់សញ្ញាសម្ងាត់សម្រាប់អត្ថបទ។
-
ការវិភាគកំហុស ៖ ដាក់កំហុសជាក្រុមតាមចំណិត - ករណីគែមមួយអាចអូសអ្វីៗគ្រប់យ៉ាងចុះក្រោម។
-
Repro : កំណត់គ្រាប់ពូជ កត់ត្រាអ៊ីពែរប៉ារ៉ាម រក្សាទុកចំណុចត្រួតពិនិត្យ។ ខ្ញុំសន្យាថាអ្នកនឹងដឹងគុណនៅពេលអនាគត។ [2], [3]
នៅពេលមានការសង្ស័យ សូមរំលឹកឡើងវិញនូវមូលដ្ឋានគ្រឹះ។ មូលដ្ឋានគ្រឹះនៅតែជាត្រីវិស័យ។ [1], [2]
ពាក្យប្រៀបធៀបតូចមួយដែលស្ទើរតែដំណើរការបាន 🪴
ការហ្វឹកហាត់គំរូគឺដូចជាការស្រោចទឹករុក្ខជាតិដោយប្រើក្បាលបាញ់ចម្លែក។ ស្រោចទឹកច្រើនពេកធ្វើឱ្យភក់ពេញ។ ស្រោចទឹកតិចពេកធ្វើឱ្យគ្រោះរាំងស្ងួតមិនសមស្រប។ ចង្វាក់ត្រឹមត្រូវ ជាមួយនឹងពន្លឺព្រះអាទិត្យពីទិន្នន័យល្អ និងសារធាតុចិញ្ចឹមពីគោលបំណងស្អាត នោះអ្នកនឹងទទួលបានការលូតលាស់។ មែនហើយ វាពិបាកបន្តិច ប៉ុន្តែវានៅតែជាប់បានយូរ។.
តើ AI រៀនយ៉ាងដូចម្តេច? ប្រមូលផ្តុំវាទាំងអស់ 🧾
គំរូមួយចាប់ផ្តើមដោយចៃដន្យ។ តាមរយៈការអាប់ដេតដែលមានមូលដ្ឋានលើជម្រាល ដែលដឹកនាំដោយការខាតបង់ វាតម្រឹមប៉ារ៉ាម៉ែត្ររបស់វាជាមួយនឹងលំនាំនៅក្នុងទិន្នន័យ។ ការតំណាងលេចឡើងដែលធ្វើឱ្យការទស្សន៍ទាយងាយស្រួល។ ការវាយតម្លៃប្រាប់អ្នកថាតើការរៀនសូត្រគឺពិតប្រាកដ មិនមែនជារឿងចៃដន្យឬអត់។ ហើយការធ្វើម្តងទៀត - ជាមួយនឹងរបាំងសុវត្ថិភាព - ប្រែក្លាយការបង្ហាញទៅជាប្រព័ន្ធដែលអាចទុកចិត្តបាន។ នោះហើយជារឿងរ៉ាវទាំងមូល ជាមួយនឹងអារម្មណ៍អាថ៌កំបាំងតិចជាងអ្វីដែលវាហាក់ដូចជាដំបូង។ [1]–[4]
កំណត់ចំណាំចុងក្រោយ - វែងពេក មិនបានអាន 🎁
-
តើ AI រៀនយ៉ាងដូចម្តេច? ដោយកាត់បន្ថយការខាតបង់ជាមួយនឹងជម្រាលលើឧទាហរណ៍ជាច្រើន។ [1], [2]
-
ទិន្នន័យល្អ គោលបំណងច្បាស់លាស់ និងការបង្កើនប្រសិទ្ធភាពដែលមានស្ថេរភាពធ្វើឱ្យការរៀនសូត្រមានភាពរឹងមាំ។ [1]–[3]
-
ការធ្វើឱ្យមានលក្ខណៈទូទៅល្អជាងការទន្ទេញចាំជានិច្ច។ [1]
-
សុវត្ថិភាព ការវាយតម្លៃ និងការធ្វើម្តងទៀត ប្រែក្លាយគំនិតឆ្លាតវៃទៅជាផលិតផលដែលអាចទុកចិត្តបាន។ [3], [4]
-
ចាប់ផ្តើមដោយសាមញ្ញ វាស់វែងឱ្យបានល្អ និងកែលម្អដោយការជួសជុលទិន្នន័យ មុនពេលអ្នកដេញតាមស្ថាបត្យកម្មកម្រនិងអសកម្ម។ [2], [3]
ឯកសារយោង
-
Goodfellow, Bengio, Courville - ការរៀនសូត្រស៊ីជម្រៅ (អត្ថបទអនឡាញឥតគិតថ្លៃ)។ តំណភ្ជាប់
-
ស្ទែនហ្វដ CS231n - បណ្តាញសរសៃប្រសាទ Convolutional សម្រាប់ការសម្គាល់ដែលមើលឃើញ (កំណត់ចំណាំវគ្គសិក្សា និងកិច្ចការផ្ទះ)។ តំណភ្ជាប់
-
Google - វគ្គសិក្សាអំពីការគាំងនៃការរៀនម៉ាស៊ីន៖ រង្វាស់ចំណាត់ថ្នាក់ (ភាពត្រឹមត្រូវ ភាពជាក់លាក់ ការហៅមកវិញ ROC/AUC) ។ តំណភ្ជាប់
-
NIST - ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យ AI (AI RMF 1.0) ។ តំណភ្ជាប់
-
OpenAI - ការរៀនសូត្រពីចំណង់ចំណូលចិត្តរបស់មនុស្ស (ទិដ្ឋភាពទូទៅនៃការបណ្តុះបណ្តាលផ្អែកលើចំណង់ចំណូលចិត្ត)។ តំណភ្ជាប់