តើ AI រៀនយ៉ាងដូចម្តេច?

តើ AI រៀនយ៉ាងដូចម្តេច? ការណែនាំនេះស្រាយចម្ងល់អំពីគំនិតធំៗជាភាសាសាមញ្ញ - ជាមួយនឹងឧទាហរណ៍ ការបង្វែរតូចៗ និងពាក្យប្រៀបធៀបមិនល្អឥតខ្ចោះមួយចំនួនដែលនៅតែជួយបាន។ ចូរយើងចាប់ផ្តើមវា។ 🙂

អត្ថបទដែលអ្នកប្រហែលជាចូលចិត្តអានបន្ទាប់ពីនេះ៖

🔗 តើ AI ព្យាករណ៍ជាអ្វី?
របៀបដែលគំរូព្យាករណ៍ព្យាករណ៍លទ្ធផលដោយប្រើទិន្នន័យប្រវត្តិសាស្ត្រ និងពេលវេលាជាក់ស្តែង។.

🔗 តើឧស្សាហកម្មអ្វីខ្លះដែល AI នឹងរំខាន
វិស័យនានាទំនងជាត្រូវបានផ្លាស់ប្តូរដោយប្រព័ន្ធស្វ័យប្រវត្តិកម្ម ការវិភាគ និងភ្នាក់ងារ។.

🔗 តើ GPT តំណាងឱ្យអ្វី
ការពន្យល់ច្បាស់លាស់អំពីអក្សរកាត់ GPT និងប្រភពដើម។.

🔗 តើជំនាញ AI ជាអ្វី?
សមត្ថភាពស្នូលសម្រាប់ការកសាង ការដាក់ពង្រាយ និងគ្រប់គ្រងប្រព័ន្ធ AI ។

ដូច្នេះ តើវាធ្វើវាដោយរបៀបណា? ✅

នៅពេលដែលមនុស្សសួរថា តើ AI រៀនដោយរបៀបណា? ជាធម្មតាពួកគេចង់មានន័យថា តើគំរូមានប្រយោជន៍យ៉ាងដូចម្តេច ជំនួសឱ្យប្រដាប់ក្មេងលេងគណិតវិទ្យាដ៏ប្រណិត។ ចម្លើយគឺជារូបមន្តមួយ៖

គោលបំណងច្បាស់លាស់ - អនុគមន៍បាត់បង់ដែលកំណត់អត្ថន័យនៃពាក្យ "ល្អ"។ [1]
ទិន្នន័យដែលមានគុណភាព - មានភាពចម្រុះ ស្អាត និងពាក់ព័ន្ធ។ បរិមាណជួយបានច្រើន; ភាពចម្រុះជួយបានច្រើន។ [1]
ការបង្កើនប្រសិទ្ធភាពដែលមានស្ថេរភាព - ការចុះជម្រាលជាមួយនឹងល្បិចដើម្បីជៀសវាងការរង្គើចេញពីច្រាំងថ្មចោទ។ [1], [2]
ការធ្វើឱ្យមានលក្ខណៈទូទៅ - ភាពជោគជ័យលើទិន្នន័យថ្មី មិនមែនគ្រាន់តែសំណុំបណ្តុះបណ្តាលនោះទេ។ [1]
រង្វិលជុំមតិប្រតិកម្ម - ការវាយតម្លៃ ការវិភាគកំហុស និងការធ្វើម្តងទៀត។ [2], [3]
សុវត្ថិភាព និងភាពជឿជាក់ - របាំងការពារ ការធ្វើតេស្ត និងឯកសារ ដូច្នេះវាមិនមែនជាភាពវឹកវរទេ។ [4]

សម្រាប់មូលដ្ឋានគ្រឹះដែលងាយស្រួលយល់ អត្ថបទសិក្សាស៊ីជម្រៅបែបបុរាណ កំណត់ចំណាំវគ្គសិក្សាដែលងាយស្រួលមើលឃើញ និងវគ្គសិក្សារហ័សដែលអនុវត្តជាក់ស្តែងគ្របដណ្តប់លើចំណុចសំខាន់ៗដោយមិនចាំបាច់លង់លក់ក្នុងនិមិត្តសញ្ញាឡើយ។ [1]–[3]

តើ AI រៀនយ៉ាងដូចម្តេច? ចម្លើយខ្លីជាភាសាអង់គ្លេសសាមញ្ញ ✍️

គំរូ AI ចាប់ផ្តើមជាមួយតម្លៃប៉ារ៉ាម៉ែត្រចៃដន្យ។ វាធ្វើការព្យាករណ៍។ អ្នករកពិន្ទុការព្យាករណ៍នោះជាមួយនឹង ការខាតបង់ ។ បន្ទាប់មកអ្នករុញប៉ារ៉ាម៉ែត្រទាំងនោះដើម្បីកាត់បន្ថយការខាតបង់ដោយប្រើ ជម្រាល ។ ធ្វើរង្វិលជុំនេះម្តងទៀតនៅទូទាំងឧទាហរណ៍ជាច្រើនរហូតដល់គំរូឈប់កែលម្អ (ឬអ្នកអស់អាហារសម្រន់)។ នោះគឺជារង្វិលជុំហ្វឹកហាត់ក្នុងមួយដង្ហើម។ [1], [2]

ប្រសិនបើអ្នកចង់បានភាពជាក់លាក់បន្ថែមទៀត សូមមើលផ្នែកស្តីពីការចុះជម្រាល និងការសាយភាយត្រឡប់ក្រោយខាងក្រោម។ សម្រាប់ប្រវត្តិរហ័ស និងងាយយល់ ការបង្រៀនខ្លីៗ និងមន្ទីរពិសោធន៍អាចរកបានយ៉ាងទូលំទូលាយ។ [2], [3]

មូលដ្ឋានគ្រឹះ៖ ទិន្នន័យ គោលបំណង ការបង្កើនប្រសិទ្ធភាព 🧩

ទិន្នន័យ ៖ ធាតុចូល (x) និងគោលដៅ (y)។ ទិន្នន័យកាន់តែទូលំទូលាយ និងស្អាតជាងមុន ឱកាសរបស់អ្នកក្នុងការធ្វើឱ្យមានលក្ខណៈទូទៅកាន់តែល្អ។ ការរៀបចំទិន្នន័យមិនមែនជារឿងអស្ចារ្យទេ ប៉ុន្តែវាជាវីរបុរសដែលមិនសូវមានអ្នកស្គាល់។ [1]
គំរូ ៖ អនុគមន៍ (f_\theta(x)) ដែលមានប៉ារ៉ាម៉ែត្រ (\theta)។ បណ្តាញសរសៃប្រសាទគឺជាជង់នៃឯកតាសាមញ្ញៗ ដែលរួមបញ្ចូលគ្នាតាមវិធីស្មុគស្មាញ—ឥដ្ឋ Lego ប៉ុន្តែទន់ជាង។ [1]
គោលបំណង ៖ ការខាតបង់ (L(f_\theta(x), y)) ដែលវាស់ស្ទង់កំហុស។ ឧទាហរណ៍៖ កំហុសមធ្យមការ៉េ (តំរែតំរង់) និង cross-entropy (ចំណាត់ថ្នាក់)។ [1]
ការបង្កើនប្រសិទ្ធភាព ៖ ប្រើការចុះជម្រាល (ស្តូកាស្ទិក) ដើម្បីធ្វើបច្ចុប្បន្នភាពប៉ារ៉ាម៉ែត្រ៖ (\theta \leftarrow \theta - \eta \nabla_\theta L)។ អត្រារៀន (\eta): ធំពេក ហើយអ្នកលោតចុះមក។ តូចពេក ហើយអ្នកងងុយគេងជារៀងរហូត។ [2]

សម្រាប់ការណែនាំអំពីមុខងារបាត់បង់ និងការបង្កើនប្រសិទ្ធភាព កំណត់ចំណាំបុរាណអំពីល្បិចហ្វឹកហាត់ និងចំណុចខ្វះខាតគឺជាការអានរំលងដ៏ល្អ។ [2]

ការរៀនសូត្រដែលមានការត្រួតពិនិត្យ៖ រៀនពីឧទាហរណ៍ដែលមានស្លាក 🎯

គំនិត ៖ បង្ហាញគូគំរូនៃការបញ្ចូល និងចម្លើយត្រឹមត្រូវ។ គំរូរៀនការគូសផែនទី (x \rightarrow y)។

ភារកិច្ចទូទៅ ៖ ការចាត់ថ្នាក់រូបភាព ការវិភាគអារម្មណ៍ ការទស្សន៍ទាយតាមតារាង ការស្គាល់ការនិយាយ។
ការខាតបង់ធម្មតា ៖ ឆ្លងកាត់អង់ត្រូពីសម្រាប់ការចាត់ថ្នាក់ កំហុសមធ្យមការ៉េសម្រាប់ការតំរែតំរង់។ [1]
គុណវិបត្តិ ៖ សំឡេងរំខានលើស្លាក ភាពមិនស្មើគ្នានៃថ្នាក់ ការលេចធ្លាយទិន្នន័យ។
ការជួសជុល ៖ ការយកគំរូតាមស្រទាប់ ការខាតបង់ដ៏រឹងមាំ ការធ្វើឱ្យមានលក្ខណៈធម្មតា និងការប្រមូលទិន្នន័យចម្រុះជាងមុន។ [1], [2]

ដោយផ្អែកលើស្តង់ដារ និងការអនុវត្តផលិតកម្មរាប់ទសវត្សរ៍ ការរៀនសូត្រដែលមានការត្រួតពិនិត្យនៅតែជាកម្លាំងចលករ ពីព្រោះលទ្ធផលអាចទស្សន៍ទាយបាន ហើយរង្វាស់គឺសាមញ្ញ។ [1], [3]

ការរៀនសូត្រដោយមិនមានការត្រួតពិនិត្យ និងការរៀនសូត្រដោយខ្លួនឯង៖ រៀនអំពីរចនាសម្ព័ន្ធនៃទិន្នន័យ 🔍

ដែលមិនមានការត្រួតពិនិត្យ រៀនលំនាំដោយគ្មានស្លាក។

ការដាក់ជាក្រុម ៖ ដាក់ជាក្រុមចំណុចស្រដៀងគ្នា - មធ្យមភាគ k គឺសាមញ្ញ និងមានប្រយោជន៍គួរឱ្យភ្ញាក់ផ្អើល។
ការកាត់បន្ថយវិមាត្រ ៖ បង្ហាប់ទិន្នន័យទៅទិសដៅសំខាន់ៗ—PCA គឺជាឧបករណ៍ច្រកផ្លូវ។
ការធ្វើគំរូដង់ស៊ីតេ/បង្កើត ៖ ស្វែងយល់ពីការចែកចាយទិន្នន័យដោយខ្លួនឯង។ [1]

ការត្រួតពិនិត្យដោយខ្លួនឯង គឺជាម៉ាស៊ីនទំនើប៖ គំរូបង្កើតការត្រួតពិនិត្យផ្ទាល់ខ្លួនរបស់ពួកគេ (ការទស្សន៍ទាយបិទបាំង ការរៀនផ្ទុយគ្នា) ដែលអនុញ្ញាតឱ្យអ្នកហ្វឹកហាត់ជាមុនលើមហាសមុទ្រនៃទិន្នន័យដែលមិនមានស្លាក និងកែសម្រួលនៅពេលក្រោយ។ [1]

ការរៀនសូត្របែបពង្រឹងសមត្ថភាព៖ រៀនដោយការអនុវត្ត និងការទទួលបានមតិកែលម្អ 🕹️

ភ្នាក់ងារ ម្នាក់ ធ្វើអន្តរកម្មជាមួយ បរិស្ថាន ទទួលបាន រង្វាន់ និងរៀន គោលការណ៍ ដែលបង្កើនរង្វាន់រយៈពេលវែងឲ្យបានអតិបរមា។

ធាតុស្នូល ៖ ស្ថានភាព សកម្មភាព រង្វាន់ គោលនយោបាយ តម្លៃ មុខងារ។
ក្បួនដោះស្រាយ ៖ ការរៀនសូត្រ Q, ជម្រាលគោលនយោបាយ, អ្នកដើរតួ-អ្នករិះគន់។
ការរុករក ទល់នឹង ការកេងប្រវ័ញ្ច ៖ សាកល្បងរបស់ថ្មីៗ ឬប្រើប្រាស់អ្វីដែលមានប្រសិទ្ធភាពឡើងវិញ។
ការផ្ទេរឥណទាន ៖ តើសកម្មភាពណាដែលបណ្តាលឱ្យមានលទ្ធផលអ្វី?

មតិប្រតិកម្មរបស់មនុស្សអាចណែនាំការបណ្តុះបណ្តាលនៅពេលដែលរង្វាន់មានភាពរញ៉េរញ៉ៃ - ចំណាត់ថ្នាក់ ឬចំណូលចិត្តជួយបង្កើតឥរិយាបថដោយមិនចាំបាច់សរសេរកូដដោយដៃនូវរង្វាន់ដ៏ល្អឥតខ្ចោះនោះទេ។ [5]

ការរៀនសូត្រស៊ីជម្រៅ ការទ្រទ្រង់ពីក្រោយ និងការចុះជម្រាល - បេះដូងដែលកំពុងលោតញាប់ 🫀

បណ្តាញសរសៃប្រសាទគឺជាសមាសធាតុនៃអនុគមន៍សាមញ្ញៗ។ ដើម្បីរៀន ពួកវាពឹងផ្អែកលើ ការសាយភាយត្រឡប់មកវិញ ៖

បញ្ជូនបន្ត ៖ គណនាការព្យាករណ៍ពីធាតុចូល។
ការខាតបង់ ៖ កំហុសវាស់វែងរវាងការព្យាករណ៍ និងគោលដៅ។
ការឆ្លងកាត់ថយក្រោយ ៖ អនុវត្តច្បាប់ខ្សែសង្វាក់ដើម្បីគណនាជម្រាលនៃការខាតបង់លើប៉ារ៉ាម៉ែត្រនីមួយៗ។
ការអាប់ដេត ៖ ជំរុញប៉ារ៉ាម៉ែត្រប្រឆាំងនឹងជម្រាលដោយប្រើឧបករណ៍បង្កើនប្រសិទ្ធភាព។

វ៉ារ្យ៉ង់ដូចជា momentum, RMSProp និង Adam ធ្វើឱ្យការហ្វឹកហាត់មិនសូវមានលក្ខណៈឆេវឆាវ។ វិធីសាស្ត្រធ្វើឱ្យមានលក្ខណៈធម្មតាដូចជា ការឈប់ហ្វឹកហាត់ ការ សម្រកទម្ងន់ និង ការឈប់ដំបូង ជួយគំរូឱ្យធ្វើឱ្យមានលក្ខណៈទូទៅជំនួសឱ្យការទន្ទេញចាំ។ [1], [2]

Transformers និងការយកចិត្តទុកដាក់៖ ហេតុអ្វីបានជាម៉ូដែលទំនើបមានអារម្មណ៍ឆ្លាតវៃ 🧠✨

ឧបករណ៍បំលែងបានជំនួសការរៀបចំដដែលៗជាច្រើននៅក្នុងភាសា និងចក្ខុវិស័យ។ ល្បិចសំខាន់គឺ ការយកចិត្តទុកដាក់ដោយខ្លួនឯង ដែលអនុញ្ញាតឱ្យគំរូថ្លឹងថ្លែងផ្នែកផ្សេងៗគ្នានៃការបញ្ចូលរបស់វាអាស្រ័យលើបរិបទ។ ការអ៊ិនកូដទីតាំងដោះស្រាយលំដាប់ ហើយ ការយកចិត្តទុកដាក់ច្រើនក្បាល អនុញ្ញាតឱ្យគំរូផ្តោតលើទំនាក់ទំនងផ្សេងៗគ្នាក្នុងពេលតែមួយ។ ការធ្វើមាត្រដ្ឋាន - ទិន្នន័យចម្រុះជាងមុន ប៉ារ៉ាម៉ែត្រកាន់តែច្រើន ការហ្វឹកហាត់យូរជាងមុន - ជារឿយៗជួយ ដោយកាត់បន្ថយផលចំណេញ និងការកើនឡើងនៃថ្លៃដើម។ [1], [2]

ការធ្វើឱ្យទូទៅ ការធ្វើឱ្យសមស្របពេក និងរបាំលំអៀង-វ៉ារ្យង់ 🩰

តារាម៉ូដែលអាចពូកែខាងហ្វឹកហាត់ ហើយនៅតែបរាជ័យក្នុងពិភពពិត។.

ការសមលើសកម្រិត ៖ ទន្ទេញសំឡេងរំខាន។ កំហុសក្នុងការហ្វឹកហាត់ថយចុះ កំហុសក្នុងការសាកល្បងឡើងលើ។
មិនសមល្មម ៖ សាមញ្ញពេក; ខកខានសញ្ញា។
ការសម្របសម្រួលភាពលំអៀង-ភាពប្រែប្រួល ៖ ភាពស្មុគស្មាញកាត់បន្ថយភាពលំអៀង ប៉ុន្តែអាចបង្កើនភាពប្រែប្រួល។

របៀបធ្វើឱ្យទូទៅកាន់តែប្រសើរឡើង:

ទិន្នន័យចម្រុះជាងមុន - ប្រភព ដែន និងករណីគែមផ្សេងៗគ្នា។.
ការធ្វើឱ្យប្រក្រតីកម្ម - ការបោះបង់ចោលការសិក្សា ការស្រកទម្ងន់ ការបង្កើនទិន្នន័យ។.
ការផ្ទៀងផ្ទាត់ត្រឹមត្រូវ - សំណុំតេស្តស្អាត ការផ្ទៀងផ្ទាត់ឆ្លងសម្រាប់ទិន្នន័យតូចៗ។.
ការតាមដានការរសាត់បាត់ - ការចែកចាយទិន្នន័យរបស់អ្នកនឹងផ្លាស់ប្តូរតាមពេលវេលា។.

ការអនុវត្តដែលយល់ដឹងពីហានិភ័យកំណត់សកម្មភាពទាំងនេះជាសកម្មភាពវដ្តជីវិត - ការគ្រប់គ្រង ការគូសផែនទី ការវាស់វែង និងការគ្រប់គ្រង - មិនមែនជាបញ្ជីត្រួតពិនិត្យម្តងម្កាលនោះទេ។ [4]

ម៉ែត្រិចដែលសំខាន់៖ របៀបដែលយើងដឹងថាការរៀនសូត្របានកើតឡើង 📈

ចំណាត់ថ្នាក់ ៖ ភាពត្រឹមត្រូវ, ភាពជាក់លាក់, ការចងចាំ, F1, ROC AUC។ ទិន្នន័យមិនមានតុល្យភាពទាមទារខ្សែកោងភាពជាក់លាក់-ការចងចាំ។ [3]
តំរែតំរង់ ៖ MSE, MAE, (R^2)។ [1]
ចំណាត់ថ្នាក់/ការទាញយក ៖ MAP, NDCG, recall@K. [1]
គំរូបង្កើត ៖ ភាពច្របូកច្របល់ (ភាសា) BLEU/ROUGE/CIDer (អត្ថបទ) ពិន្ទុផ្អែកលើ CLIP (ពហុម៉ូឌុល) និងការវាយតម្លៃដ៏សំខាន់បំផុតរបស់មនុស្ស។ [1], [3]

ជ្រើសរើសម៉ែត្រិចដែលស្របនឹងផលប៉ះពាល់របស់អ្នកប្រើប្រាស់។ ការកើនឡើងតិចតួចនៃភាពត្រឹមត្រូវអាចមិនពាក់ព័ន្ធទេ ប្រសិនបើលទ្ធផលវិជ្ជមានក្លែងក្លាយជាតម្លៃពិតប្រាកដ។ [3]

លំហូរការងារបណ្តុះបណ្តាលនៅក្នុងពិភពពិត៖ គំរូសាមញ្ញមួយ 🛠️

កំណត់បញ្ហា - កំណត់ធាតុចូល លទ្ធផល ការរឹតបន្តឹង និងលក្ខណៈវិនិច្ឆ័យជោគជ័យ។
បំពង់ទិន្នន័យ - ការប្រមូល ការដាក់ស្លាក ការសម្អាត ការបំបែក ការបង្កើន។
បន្ទាត់គោល - ចាប់ផ្តើមសាមញ្ញ; បន្ទាត់គោលលីនេអ៊ែរ ឬដើមឈើមានការប្រកួតប្រជែងគួរឱ្យភ្ញាក់ផ្អើល។
ការធ្វើគំរូ - សាកល្បងគ្រួសារមួយចំនួន៖ ដើមឈើដែលជំរុញដោយជម្រាល (តារាង), CNNs (រូបភាព), Transformers (អត្ថបទ)។
ការបណ្តុះបណ្តាល - កាលវិភាគ យុទ្ធសាស្ត្រអត្រានៃការរៀនសូត្រ ចំណុចត្រួតពិនិត្យ ភាពជាក់លាក់ចម្រុះប្រសិនបើចាំបាច់។
ការវាយតម្លៃ - ការកាត់ចេញ និងការវិភាគកំហុស។ សូមក្រឡេកមើលកំហុស មិនមែនគ្រាន់តែមធ្យមភាគនោះទេ។
ការដាក់ពង្រាយ - បំពង់បង្ហូរទិន្នន័យសន្និដ្ឋាន ការត្រួតពិនិត្យ ការកត់ត្រា ផែនការរំកិលថយក្រោយ។
ធ្វើឡើងវិញ - ទិន្នន័យប្រសើរឡើង ការលៃតម្រូវល្អប្រសើរ ឬការកែប្រែស្ថាបត្យកម្ម។

ករណីតូច ៖ គម្រោងចាត់ថ្នាក់តាមអ៊ីមែលបានចាប់ផ្តើមជាមួយនឹងបន្ទាត់គោលលីនេអ៊ែរសាមញ្ញមួយ បន្ទាប់មកបានលៃតម្រូវឧបករណ៍បំលែងដែលបានហ្វឹកហាត់ជាមុន។ ជ័យជម្នះដ៏ធំបំផុតមិនមែនជាគំរូនោះទេ - វាគឺជាការរឹតបន្តឹងចំណាត់ថ្នាក់ស្លាក និងបន្ថែមប្រភេទ "គែម" ដែលមិនសូវតំណាង។ នៅពេលដែលពួកវាត្រូវបានគ្របដណ្តប់ ការផ្ទៀងផ្ទាត់ F1 ទីបំផុតបានតាមដានការអនុវត្តក្នុងពិភពពិត។ (អនាគតរបស់អ្នក៖ ដឹងគុណយ៉ាងខ្លាំង។)

គុណភាពទិន្នន័យ ការដាក់ស្លាក និងសិល្បៈដ៏ប៉ិនប្រសប់នៃការមិនកុហកខ្លួនឯង 🧼

សំរាមចូលហើយ ស្ដាយក្រោយ។ គោលការណ៍ណែនាំសម្រាប់ការដាក់ស្លាកគួរតែស៊ីសង្វាក់គ្នា អាចវាស់វែងបាន និងពិនិត្យឡើងវិញ។ ការព្រមព្រៀងគ្នារវាងអ្នកអត្ថាធិប្បាយគឺមានសារៈសំខាន់។.

សរសេរតារាងវាយតម្លៃជាមួយឧទាហរណ៍ ករណីជ្រុង និងចំណុចបំបែកពិន្ទុ។.
សំណុំទិន្នន័យសវនកម្មសម្រាប់ឯកសារស្ទួន និងឯកសារស្ទើរតែស្ទួន។.
តាមដានប្រភពដើម - កន្លែងដែលឧទាហរណ៍នីមួយៗមកពីណា និងមូលហេតុដែលវាត្រូវបានរួមបញ្ចូល។.
វាស់ស្ទង់ការគ្របដណ្តប់ទិន្នន័យទល់នឹងសេណារីយ៉ូអ្នកប្រើប្រាស់ពិតប្រាកដ មិនមែនគ្រាន់តែជាស្តង់ដារដ៏ស្អាតស្អំនោះទេ។.

ទាំងនេះសមស្របយ៉ាងល្អឥតខ្ចោះនៅក្នុងក្របខ័ណ្ឌធានា និងអភិបាលកិច្ចទូលំទូលាយ ដែលអ្នកពិតជាអាចធ្វើប្រតិបត្តិការបាន។ [4]

ការរៀនសូត្រផ្ទេរ ការលៃតម្រូវ និងការភ្ជាប់ - ប្រើឡើងវិញនូវការលើកធ្ងន់ៗ ♻️

ម៉ូដែលដែលបានទទួលការបណ្តុះបណ្តាលជាមុនរៀនពីការតំណាងទូទៅ។ ការលៃតម្រូវល្អិតល្អន់សម្របពួកវាទៅនឹងភារកិច្ចរបស់អ្នកជាមួយនឹងទិន្នន័យតិចជាងមុន។.

ការស្រង់ចេញលក្ខណៈពិសេស ៖ បង្កកឆ្អឹងខ្នង ហ្វឹកហាត់ក្បាលតូចមួយ។
ការលៃតម្រូវពេញលេញ ៖ ធ្វើបច្ចុប្បន្នភាពប៉ារ៉ាម៉ែត្រទាំងអស់សម្រាប់សមត្ថភាពអតិបរមា។
វិធីសាស្ត្រដែលមានប្រសិទ្ធភាពប៉ារ៉ាម៉ែត្រ ៖ អាដាប់ទ័រ ការអាប់ដេតកម្រិតទាបបែប LoRA ល្អនៅពេលដែលការគណនាមានភាពតឹងតែង។
ការសម្របខ្លួនទៅនឹងដែន ៖ តម្រឹមការបង្កប់ឆ្លងកាត់ដែន; ការផ្លាស់ប្តូរតិចតួច ផលចំណេញធំ។ [1], [2]

គំរូនៃការប្រើប្រាស់ឡើងវិញនេះគឺជាមូលហេតុដែលគម្រោងទំនើបៗអាចដំណើរការបានលឿនដោយមិនចាំបាច់មានថវិកាច្រើនហួសហេតុ។.

សុវត្ថិភាព ភាពជឿជាក់ និងការតម្រឹម - ប៊ីតដែលមិនមែនជាជម្រើស 🧯

ការរៀនសូត្រមិនមែនគ្រាន់តែជាភាពត្រឹមត្រូវនោះទេ។ អ្នកក៏ចង់បានគំរូដែលរឹងមាំ យុត្តិធម៌ និងស្របតាមការប្រើប្រាស់ដែលបានគ្រោងទុកផងដែរ។.

ភាពរឹងមាំផ្ទុយគ្នា ៖ ការរំខានតិចតួចអាចបញ្ឆោតគំរូ។
ភាពលំអៀង និងភាពយុត្តិធម៌ ៖ វាស់ស្ទង់ការអនុវត្តក្រុមរង មិនមែនគ្រាន់តែមធ្យមភាគសរុបនោះទេ។
ការបកស្រាយ ៖ ការបញ្ជាក់លក្ខណៈពិសេស និងការស៊ើបអង្កេតជួយអ្នកឱ្យយល់ ពីមូលហេតុ ។
មនុស្សនៅក្នុងរង្វិលជុំ ៖ ផ្លូវនៃការកើនឡើងសម្រាប់ការសម្រេចចិត្តមិនច្បាស់លាស់ ឬមានផលប៉ះពាល់ខ្ពស់។ [4], [5]

ការរៀនសូត្រដោយផ្អែកលើចំណង់ចំណូលចិត្តគឺជាវិធីជាក់ស្តែងមួយដើម្បីរួមបញ្ចូលការវិនិច្ឆ័យរបស់មនុស្សនៅពេលដែលគោលបំណងមានភាពមិនច្បាស់លាស់។ [5]

សំណួរដែលសួរញឹកញាប់ក្នុងរយៈពេលមួយនាទី - ភ្លើងឆេះយ៉ាងលឿន ⚡

ដូច្នេះ តាមពិតទៅ តើ AI រៀនដោយរបៀបណា? តាមរយៈការបង្កើនប្រសិទ្ធភាពម្តងហើយម្តងទៀតប្រឆាំងនឹងការខាតបង់ ជាមួយនឹងជម្រាលដែលណែនាំប៉ារ៉ាម៉ែត្រឆ្ពោះទៅរកការព្យាករណ៍កាន់តែប្រសើរ។ [1], [2]
តើទិន្នន័យច្រើនតែងតែជួយទេ? ជាធម្មតា រហូតដល់ផលចំណេញថយចុះ។ ភាពចម្រុះច្រើនតែល្អជាងបរិមាណឆៅ។ [1]
ចុះបើស្លាកមានភាពរញ៉េរញ៉ៃ? ប្រើវិធីសាស្ត្រដែលមានសំឡេងរំខាន ការវាយតម្លៃកាន់តែប្រសើរ និងពិចារណាអំពីការហ្វឹកហ្វឺនជាមុនដែលមានការត្រួតពិនិត្យដោយខ្លួនឯង។ [1]
ហេតុអ្វីបានជាឧបករណ៍បំលែងអគ្គិសនីមានឥទ្ធិពល? ការយកចិត្តទុកដាក់ធ្វើមាត្រដ្ឋានបានល្អ និងចាប់យកភាពអាស្រ័យរយៈពេលវែង។ ឧបករណ៍មានភាពចាស់ទុំ។ [1], [2]
តើខ្ញុំដឹងដោយរបៀបណាថាខ្ញុំបានបញ្ចប់ការបណ្តុះបណ្តាល? ការបាត់បង់សុពលភាពថយចុះ រង្វាស់មានស្ថេរភាព ហើយទិន្នន័យថ្មីមានដំណើរការដូចការរំពឹងទុក - បន្ទាប់មកតាមដានការរសាត់បាត់។ [3], [4]

តារាងប្រៀបធៀប - ឧបករណ៍ដែលអ្នកពិតជាអាចប្រើប្រាស់បានសព្វថ្ងៃនេះ 🧰

ចេតនាចម្លែកបន្តិច។ តម្លៃគឺសម្រាប់បណ្ណាល័យស្នូល - ជាក់ស្តែង ការបណ្តុះបណ្តាលទ្រង់ទ្រាយធំមានថ្លៃដើមហេដ្ឋារចនាសម្ព័ន្ធ។.

ឧបករណ៍	ល្អបំផុតសម្រាប់	តម្លៃ	ហេតុអ្វីបានជាវាដំណើរការបានល្អ
PyTorch	អ្នកស្រាវជ្រាវ អ្នកសាងសង់	ឥតគិតថ្លៃ - បើកចំហ src	ក្រាហ្វថាមវន្ត ប្រព័ន្ធអេកូឡូស៊ីដ៏រឹងមាំ ការបង្រៀនដ៏អស្ចារ្យ។.
TensorFlow	ក្រុមផលិតកម្ម	ឥតគិតថ្លៃ - បើកចំហ src	ការបម្រើមនុស្សពេញវ័យ TF Lite សម្រាប់ទូរស័ព្ទចល័ត; សហគមន៍ធំ។.
រៀនដោយប្រើភាសាស្គីគីត	ទិន្នន័យតារាង, មូលដ្ឋាន	ឥតគិតថ្លៃ	API ស្អាត លឿនក្នុងការធ្វើម្តងទៀត ឯកសារល្អ។.
កេរ៉ាស	គំរូដើមរហ័ស	ឥតគិតថ្លៃ	API កម្រិតខ្ពស់លើ TF ស្រទាប់ដែលអាចអានបាន។.
ជេអ៊ិច	អ្នកប្រើប្រាស់ថាមពល, ការស្រាវជ្រាវ	ឥតគិតថ្លៃ	វ៉ិចទ័រស្វ័យប្រវត្តិ, ល្បឿន XLA, អារម្មណ៍គណិតវិទ្យាឆើតឆាយ។.
អ្នកប្រែរូបមុខឱប	NLP, ចក្ខុវិស័យ, សំឡេង	ឥតគិតថ្លៃ	ម៉ូដែលដែលបានហ្វឹកហាត់ជាមុន ការលៃតម្រូវដ៏សាមញ្ញ និងមជ្ឈមណ្ឌលដ៏ល្អ។.
ផ្លេកបន្ទោរ	លំហូរការងារបណ្តុះបណ្តាល	ស្នូលសេរី	រចនាសម្ព័ន្ធ, ការកត់ត្រា, ថ្មច្រើន GPU រួមបញ្ចូល។.
XGBoost	តារាងប្រកួតប្រជែង	ឥតគិតថ្លៃ	មូលដ្ឋានរឹងមាំ ជារឿយៗឈ្នះលើទិន្នន័យដែលមានរចនាសម្ព័ន្ធ។.
ទម្ងន់ និងភាពលំអៀង	ការតាមដានការពិសោធន៍	កម្រិតឥតគិតថ្លៃ	សមត្ថភាពផលិតឡើងវិញ ប្រៀបធៀបដំណើរការ រង្វិលជុំរៀនលឿនជាងមុន។.

ឯកសារដែលមានសិទ្ធិអំណាចដើម្បីចាប់ផ្តើមជាមួយ៖ PyTorch, TensorFlow និងមគ្គុទ្ទេសក៍អ្នកប្រើប្រាស់ scikit-learn ដ៏សាមញ្ញ។ (ជ្រើសរើសមួយ បង្កើតអ្វីតូច ហើយធ្វើវាម្តងហើយម្តងទៀត)។

ស្វែងយល់ឲ្យស៊ីជម្រៅ៖ គន្លឹះជាក់ស្តែងដែលជួយសន្សំសំចៃពេលវេលារបស់អ្នក 🧭

កាលវិភាគអត្រាសិក្សា ៖ ការរលួយកូស៊ីនុស ឬវដ្តមួយអាចធ្វើឱ្យការបណ្តុះបណ្តាលមានស្ថេរភាព។
ទំហំបាច់ ៖ ធំជាងមិនតែងតែល្អជាងនោះទេ - មើលម៉ែត្រផ្ទៀងផ្ទាត់ មិនមែនគ្រាន់តែបរិមាណផលិតកម្មទេ។
ទម្ងន់ init ៖ លំនាំដើមទំនើបគឺល្អ; ប្រសិនបើការហ្វឹកហាត់ជាប់គាំង សូមពិនិត្យមើលការចាប់ផ្តើមឡើងវិញ ឬធ្វើឱ្យស្រទាប់ដំបូងមានលក្ខណៈធម្មតា។
ការធ្វើឱ្យមានលក្ខណៈធម្មតា ៖ បទដ្ឋានបាច់ ឬបទដ្ឋានស្រទាប់អាចធ្វើឱ្យការបង្កើនប្រសិទ្ធភាពរលូនយ៉ាងខ្លាំង។
ការបង្កើនទិន្នន័យ ៖ ត្រឡប់/ច្រឹប/ញ័រពណ៌សម្រាប់រូបភាព; ការបិទបាំង/ការសាប់សញ្ញាសម្ងាត់សម្រាប់អត្ថបទ។
ការវិភាគកំហុស ៖ ដាក់កំហុសជាក្រុមតាមចំណិត - ករណីគែមមួយអាចអូសអ្វីៗគ្រប់យ៉ាងចុះក្រោម។
Repro : កំណត់គ្រាប់ពូជ កត់ត្រាអ៊ីពែរប៉ារ៉ាម រក្សាទុកចំណុចត្រួតពិនិត្យ។ ខ្ញុំសន្យាថាអ្នកនឹងដឹងគុណនៅពេលអនាគត។ [2], [3]

នៅពេលមានការសង្ស័យ សូមរំលឹកឡើងវិញនូវមូលដ្ឋានគ្រឹះ។ មូលដ្ឋានគ្រឹះនៅតែជាត្រីវិស័យ។ [1], [2]

ពាក្យប្រៀបធៀបតូចមួយដែលស្ទើរតែដំណើរការបាន 🪴

ការហ្វឹកហាត់គំរូគឺដូចជាការស្រោចទឹករុក្ខជាតិដោយប្រើក្បាលបាញ់ចម្លែក។ ស្រោចទឹកច្រើនពេកធ្វើឱ្យភក់ពេញ។ ស្រោចទឹកតិចពេកធ្វើឱ្យគ្រោះរាំងស្ងួតមិនសមស្រប។ ចង្វាក់ត្រឹមត្រូវ ជាមួយនឹងពន្លឺព្រះអាទិត្យពីទិន្នន័យល្អ និងសារធាតុចិញ្ចឹមពីគោលបំណងស្អាត នោះអ្នកនឹងទទួលបានការលូតលាស់។ មែនហើយ វាពិបាកបន្តិច ប៉ុន្តែវានៅតែជាប់បានយូរ។.

តើ AI រៀនយ៉ាងដូចម្តេច? ប្រមូលផ្តុំវាទាំងអស់ 🧾

គំរូមួយចាប់ផ្តើមដោយចៃដន្យ។ តាមរយៈការអាប់ដេតដែលមានមូលដ្ឋានលើជម្រាល ដែលដឹកនាំដោយការខាតបង់ វាតម្រឹមប៉ារ៉ាម៉ែត្ររបស់វាជាមួយនឹងលំនាំនៅក្នុងទិន្នន័យ។ ការតំណាងលេចឡើងដែលធ្វើឱ្យការទស្សន៍ទាយងាយស្រួល។ ការវាយតម្លៃប្រាប់អ្នកថាតើការរៀនសូត្រគឺពិតប្រាកដ មិនមែនជារឿងចៃដន្យឬអត់។ ហើយការធ្វើម្តងទៀត - ជាមួយនឹងរបាំងសុវត្ថិភាព - ប្រែក្លាយការបង្ហាញទៅជាប្រព័ន្ធដែលអាចទុកចិត្តបាន។ នោះហើយជារឿងរ៉ាវទាំងមូល ជាមួយនឹងអារម្មណ៍អាថ៌កំបាំងតិចជាងអ្វីដែលវាហាក់ដូចជាដំបូង។ [1]–[4]

កំណត់ចំណាំចុងក្រោយ - វែងពេក មិនបានអាន 🎁

តើ AI រៀនយ៉ាងដូចម្តេច? ដោយកាត់បន្ថយការខាតបង់ជាមួយនឹងជម្រាលលើឧទាហរណ៍ជាច្រើន។ [1], [2]
ទិន្នន័យល្អ គោលបំណងច្បាស់លាស់ និងការបង្កើនប្រសិទ្ធភាពដែលមានស្ថេរភាពធ្វើឱ្យការរៀនសូត្រមានភាពរឹងមាំ។ [1]–[3]
ការធ្វើឱ្យមានលក្ខណៈទូទៅល្អជាងការទន្ទេញចាំជានិច្ច។ [1]
សុវត្ថិភាព ការវាយតម្លៃ និងការធ្វើម្តងទៀត ប្រែក្លាយគំនិតឆ្លាតវៃទៅជាផលិតផលដែលអាចទុកចិត្តបាន។ [3], [4]
ចាប់ផ្តើមដោយសាមញ្ញ វាស់វែងឱ្យបានល្អ និងកែលម្អដោយការជួសជុលទិន្នន័យ មុនពេលអ្នកដេញតាមស្ថាបត្យកម្មកម្រនិងអសកម្ម។ [2], [3]

ឯកសារយោង

Goodfellow, Bengio, Courville - ការរៀនសូត្រស៊ីជម្រៅ (អត្ថបទអនឡាញឥតគិតថ្លៃ)។ តំណភ្ជាប់
ស្ទែនហ្វដ CS231n - បណ្តាញសរសៃប្រសាទ Convolutional សម្រាប់ការសម្គាល់ដែលមើលឃើញ (កំណត់ចំណាំវគ្គសិក្សា និងកិច្ចការផ្ទះ)។ តំណភ្ជាប់
Google - វគ្គសិក្សាអំពីការគាំងនៃការរៀនម៉ាស៊ីន៖ រង្វាស់ចំណាត់ថ្នាក់ (ភាពត្រឹមត្រូវ ភាពជាក់លាក់ ការហៅមកវិញ ROC/AUC) ។ តំណភ្ជាប់
NIST - ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យ AI (AI RMF 1.0) ។ តំណភ្ជាប់
OpenAI - ការរៀនសូត្រពីចំណង់ចំណូលចិត្តរបស់មនុស្ស (ទិដ្ឋភាពទូទៅនៃការបណ្តុះបណ្តាលផ្អែកលើចំណង់ចំណូលចិត្ត)។ តំណភ្ជាប់

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ

ប្រទេស/តំបន់