ចម្លើយខ្លី៖ ការដំណើរការជាមុនរបស់ AI គឺជាសំណុំនៃជំហានដែលអាចធ្វើម្តងទៀតបាន ដែលប្រែក្លាយទិន្នន័យឆៅ និងមានភាពប្រែប្រួលខ្ពស់ទៅជាការបញ្ចូលគំរូដែលស៊ីសង្វាក់គ្នា រួមទាំងការសម្អាត ការអ៊ិនកូដ ការធ្វើមាត្រដ្ឋាន ការធ្វើសញ្ញាសម្ងាត់ និងការបំលែងរូបភាព។ វាសំខាន់ណាស់ ពីព្រោះប្រសិនបើការបញ្ចូលការបណ្តុះបណ្តាល និងការបញ្ចូលផលិតកម្មខុសគ្នា គំរូអាចបរាជ័យដោយស្ងៀមស្ងាត់។ ប្រសិនបើជំហានមួយ "រៀន" ប៉ារ៉ាម៉ែត្រ សូមដាក់វានៅលើទិន្នន័យបណ្តុះបណ្តាលតែប៉ុណ្ណោះ ដើម្បីជៀសវាងការលេចធ្លាយ។
ការដំណើរការជាមុនរបស់ AI គឺជាអ្វីគ្រប់យ៉ាងដែលអ្នកធ្វើចំពោះទិន្នន័យឆៅមុន (ហើយជួនកាលក្នុងអំឡុងពេល) ការបណ្តុះបណ្តាល ឬការសន្និដ្ឋាន ដូច្នេះគំរូមួយអាចរៀនពីវាបាន។ មិនមែនគ្រាន់តែជា "ការសម្អាត" នោះទេ។ វាគឺជាការសម្អាត ការបង្កើតរូបរាង ការធ្វើមាត្រដ្ឋាន ការអ៊ិនកូដ ការបង្កើន និងការវេចខ្ចប់ទិន្នន័យទៅជាតំណាងដែលស៊ីសង្វាក់គ្នា ដែលនឹងមិនធ្វើឱ្យគំរូរបស់អ្នកមានបញ្ហានៅពេលក្រោយឡើយ។ [1]
ចំណុចសំខាន់ៗ៖
និយមន័យ ៖ ការដំណើរការជាមុនបម្លែងតារាងឆៅ អត្ថបទ រូបភាព និងកំណត់ហេតុទៅជាមុខងារដែលត្រៀមសម្រាប់ធ្វើគំរូ។
ភាពស៊ីសង្វាក់គ្នា ៖ អនុវត្តការបំលែងដូចគ្នាក្នុងអំឡុងពេលហ្វឹកហាត់ និងការសន្និដ្ឋាន ដើម្បីការពារការបរាជ័យនៃភាពមិនស៊ីសង្វាក់គ្នា។
ការលេចធ្លាយ ៖ ដំឡើងឧបករណ៍ធ្វើមាត្រដ្ឋាន ឧបករណ៍អ៊ិនកូដឌ័រ និងឧបករណ៍ចាប់សញ្ញាលើទិន្នន័យហ្វឹកហាត់តែប៉ុណ្ណោះ។
សមត្ថភាពផលិតឡើងវិញ ៖ បង្កើតបំពង់បង្ហូរទិន្នន័យជាមួយនឹងស្ថិតិដែលអាចត្រួតពិនិត្យបាន មិនមែនលំដាប់ក្រឡាសៀវភៅកត់ត្រាបែបពិសេសទេ។
ការត្រួតពិនិត្យផលិតកម្ម ៖ តាមដានភាពលំអៀង និងការរសាត់ ដើម្បីកុំឱ្យធាតុចូលធ្វើឱ្យប៉ះពាល់ដល់ដំណើរការបន្តិចម្តងៗ។
អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖
🔗 របៀបសាកល្បងគំរូ AI សម្រាប់ដំណើរការក្នុងពិភពពិត
វិធីសាស្រ្តជាក់ស្តែងដើម្បីវាយតម្លៃភាពត្រឹមត្រូវ ភាពរឹងមាំ និងភាពលំអៀងយ៉ាងឆាប់រហ័ស។.
🔗 តើ AI បំលែងអត្ថបទទៅជាការនិយាយជាអត្ថបទឬអត់ ហើយវាដំណើរការយ៉ាងដូចម្តេច?
ពន្យល់ពីមូលដ្ឋានគ្រឹះ TTS ការប្រើប្រាស់សំខាន់ៗ និងដែនកំណត់ទូទៅនាពេលបច្ចុប្បន្ន។.
🔗 តើ AI អាចអានការសរសេរដោយដៃបានត្រឹមត្រូវនៅថ្ងៃនេះទេ?
គ្របដណ្តប់លើបញ្ហាប្រឈមនៃការទទួលស្គាល់ ឧបករណ៍ល្អបំផុត និងគន្លឹះភាពត្រឹមត្រូវ។.
🔗 តើ AI មានភាពត្រឹមត្រូវប៉ុណ្ណានៅទូទាំងភារកិច្ចទូទៅ
បំបែកកត្តាភាពត្រឹមត្រូវ ស្តង់ដារ និងភាពជឿជាក់ក្នុងពិភពពិត។.
ការដំណើរការជាមុនរបស់ AI ជាភាសាសាមញ្ញ (និងអ្វីដែលវាមិនមែន) 🤝
ការកែច្នៃជាមុនដោយ AI គឺជាការបំលែងធាតុចូលឆៅ (តារាង អត្ថបទ រូបភាព កំណត់ហេតុ) ទៅជាលក្ខណៈពិសេសដែលត្រៀមរួចជាស្រេចសម្រាប់ម៉ូដែល។ ប្រសិនបើទិន្នន័យឆៅគឺជាយានដ្ឋានដ៏រញ៉េរញ៉ៃ ការកែច្នៃជាមុនគឺអ្នកដាក់ស្លាកលើប្រអប់ បោះសំរាមដែលខូច និងដាក់របស់របរជាជង់ៗ ដើម្បីឱ្យអ្នកអាចដើរឆ្លងកាត់ដោយគ្មានរបួស។
វាមិនមែនជាគំរូខ្លួនឯងទេ។ វាជារបស់ដែលធ្វើឱ្យគំរូអាចធ្វើទៅបាន៖
-
ការប្រែក្លាយប្រភេទទៅជាលេខ (មួយ-ក្តៅ លំដាប់ ជាដើម) [1]
-
ការធ្វើមាត្រដ្ឋានជួរលេខធំៗទៅជាជួរសមហេតុផល (ស្តង់ដារភាវូបនីយកម្ម អប្បបរមា-អតិបរមា ជាដើម) [1]
-
ការធ្វើសញ្ញាសម្គាល់អត្ថបទទៅក្នុងលេខសម្គាល់ការបញ្ចូល (ហើយជាធម្មតាជារបាំងការយកចិត្តទុកដាក់) [3]
-
ការផ្លាស់ប្តូរទំហំ/ការច្រឹបរូបភាព និងការអនុវត្តការបំលែងកំណត់ទល់នឹងការបំលែងចៃដន្យឲ្យបានត្រឹមត្រូវ [4]
-
ការកសាងបំពង់បង្ហូរទិន្នន័យដែលអាចធ្វើម្តងទៀតបាន ដូច្នេះការបណ្តុះបណ្តាល និងធាតុចូល "ជីវិតពិត" មិនខុសគ្នាតាមរបៀបស្រទន់ [2]
កំណត់ចំណាំជាក់ស្តែងតូចមួយ៖ “ការដំណើរការជាមុន” រួមបញ្ចូល អ្វីដែលកើតឡើងជាប់លាប់មុនពេលគំរូឃើញធាតុចូល ។ ក្រុមខ្លះបែងចែករឿងនេះទៅជា “វិស្វកម្មលក្ខណៈពិសេស” ទល់នឹង “ការសម្អាតទិន្នន័យ” ប៉ុន្តែក្នុងជីវិតពិត ខ្សែបន្ទាត់ទាំងនោះមិនច្បាស់លាស់។

ហេតុអ្វីបានជាការកែច្នៃជាមុនរបស់ AI មានសារៈសំខាន់ជាងអ្វីដែលមនុស្សទទួលស្គាល់ 😬
គំរូគឺជាឧបករណ៍ផ្គូផ្គងគំរូ មិនមែនជាឧបករណ៍អានគំនិតទេ។ ប្រសិនបើធាតុចូលរបស់អ្នកមិនស៊ីសង្វាក់គ្នា គំរូនឹងរៀនច្បាប់មិនស៊ីសង្វាក់គ្នា។ នោះមិនមែនជាទស្សនវិជ្ជាទេ វាជារឿងត្រង់ៗ។.
ការកែច្នៃជាមុនជួយអ្នក៖
-
បង្កើនស្ថេរភាពនៃការរៀនសូត្រ ដោយដាក់លក្ខណៈពិសេសទៅក្នុងការតំណាងដែលអ្នកប៉ាន់ស្មានអាចប្រើប្រាស់បានដោយភាពជឿជាក់ (ជាពិសេសនៅពេលដែលមានជាប់ពាក់ព័ន្ធនឹងការធ្វើមាត្រដ្ឋាន/ការអ៊ិនកូដ)។ [1]
-
កាត់បន្ថយសំឡេងរំខាន ដោយធ្វើឱ្យការពិតដ៏រញ៉េរញ៉ៃមើលទៅដូចជាអ្វីមួយដែលតារាម៉ូដែលអាចធ្វើឱ្យមានលក្ខណៈទូទៅ (ជំនួសឱ្យការទន្ទេញចាំវត្ថុបុរាណចម្លែកៗ)។
-
ការពាររបៀបបរាជ័យស្ងាត់ៗ ដូចជាការលេចធ្លាយ និងការហ្វឹកហាត់/ការបម្រើមិនត្រូវគ្នា (ប្រភេទដែលមើលទៅ "អស្ចារ្យ" នៅក្នុងការផ្ទៀងផ្ទាត់ ហើយបន្ទាប់មកបិទបាំងនៅក្នុងផលិតកម្ម)។ [2]
-
បង្កើនល្បឿនការធ្វើម្តងទៀត ពីព្រោះការធ្វើម្តងទៀតអាចបំលែងចង្វាក់របស់ស្ប៉ាហ្គេទីក្នុងសៀវភៅកត់ត្រាជារៀងរាល់ថ្ងៃនៃសប្តាហ៍។
ម្យ៉ាងទៀត វាជាកន្លែងដែល «ការសម្តែងជាគំរូ» ជាច្រើនពិតជាមកពី។ ដូចជា… គួរឱ្យភ្ញាក់ផ្អើលណាស់។ ពេលខ្លះវាមានអារម្មណ៍ថាអយុត្តិធម៌ ប៉ុន្តែនោះជាការពិត 🙃
អ្វីដែលធ្វើឱ្យបំពង់បង្ហូរដំណើរការមុន AI ល្អ ✅
“កំណែល្អ” នៃការកែច្នៃជាមុនជាធម្មតាមានគុណសម្បត្តិទាំងនេះ៖
-
អាចផលិតឡើងវិញបាន ៖ ការបញ្ចូលដូចគ្នា → លទ្ធផលដូចគ្នា (គ្មានភាពចៃដន្យអាថ៌កំបាំងទេ លុះត្រាតែវាជាការបង្កើនដោយចេតនា)។
-
ភាពស៊ីសង្វាក់គ្នានៃការបម្រើរថភ្លើង ៖ អ្វីក៏ដោយដែលអ្នកធ្វើនៅពេលហ្វឹកហាត់ត្រូវបានអនុវត្តតាមវិធីដូចគ្នានៅពេលសន្និដ្ឋាន (ប៉ារ៉ាម៉ែត្រដែលបានដំឡើងដូចគ្នា ផែនទីប្រភេទដូចគ្នា ការកំណត់រចនាសម្ព័ន្ធសញ្ញាសម្គាល់ដូចគ្នា ។ល។)។ [2]
-
មានសុវត្ថិភាពសម្រាប់ការលេចធ្លាយ ៖ គ្មានអ្វីនៅក្នុងការវាយតម្លៃ/ការធ្វើតេស្តដែលមានឥទ្ធិពលលើ
សមស្រប។ (ព័ត៌មានបន្ថែមអំពីអន្ទាក់នេះនៅពេលក្រោយ។) [2] -
អាចសង្កេតបាន ៖ អ្នកអាចត្រួតពិនិត្យអ្វីដែលបានផ្លាស់ប្តូរ (ស្ថិតិលក្ខណៈពិសេស ការបាត់ ចំនួនប្រភេទ) ដូច្នេះការបំបាត់កំហុសមិនមែនជាវិស្វកម្មដែលផ្អែកលើ vibes ទេ។
ប្រសិនបើការដំណើរការជាមុនរបស់អ្នកគឺជាគំនរក្រឡាសៀវភៅកត់ត្រាដែលមានឈ្មោះថា final_v7_really_final_ok … អ្នកដឹងពីរបៀបដែលវាដំណើរការ។ វាដំណើរការរហូតដល់វាមិនដំណើរការ 😬
ប្លុកសំណង់ស្នូលនៃការដំណើរការជាមុនរបស់ AI 🧱
សូមគិតអំពីការដំណើរការជាមុនដូចជាសំណុំនៃប្លុកសំណង់ដែលអ្នកបញ្ចូលទៅក្នុងបំពង់បង្ហូរ។.
១) ការសម្អាត និងការផ្ទៀងផ្ទាត់ 🧼
ភារកិច្ចធម្មតា៖
-
លុបច្បាប់ចម្លងចេញ
-
ដោះស្រាយតម្លៃដែលបាត់ (ទម្លាក់ បញ្ចូល ឬតំណាងឱ្យការបាត់ដោយច្បាស់លាស់)
-
អនុវត្តប្រភេទ ឯកតា និងជួរ
-
រកឃើញធាតុបញ្ចូលដែលមានទម្រង់មិនត្រឹមត្រូវ
-
ធ្វើឲ្យមានស្តង់ដារទ្រង់ទ្រាយអត្ថបទ (ចន្លោះទទេ ច្បាប់អក្សរធំ ភាពខុសគ្នានៃអក្សរយូនីកូដ)
ផ្នែកនេះមិនទាក់ទាញទេ ប៉ុន្តែវាការពារកំហុសឆ្គងដ៏ល្ងង់ខ្លៅបំផុត។ ខ្ញុំនិយាយដូច្នេះដោយក្តីស្រឡាញ់។.
2) ការអ៊ិនកូដទិន្នន័យប្រភេទ 🔤
ម៉ូដែលភាគច្រើនមិនអាចប្រើខ្សែអក្សរឆៅដូចជា "red" ឬ "premium_user" ។
វិធីសាស្រ្តទូទៅ៖
-
ការអ៊ិនកូដក្តៅតែមួយ (ប្រភេទ → ជួរឈរគោលពីរ) [1]
-
ការអ៊ិនកូដលំដាប់ (ប្រភេទ → លេខសម្គាល់ចំនួនគត់) [1]
រឿងសំខាន់មិនមែនថា មួយណានោះ ទេ - វាគឺថាការធ្វើផែនទីនៅតែស៊ីសង្វាក់គ្នា និងមិន "ផ្លាស់ប្តូររូបរាង" រវាងការហ្វឹកហាត់ និងការសន្និដ្ឋាន។ នោះហើយជារបៀបដែលអ្នកបញ្ចប់ដោយគំរូដែលមើលទៅល្អក្រៅបណ្តាញ ហើយដើរតួជាខ្មោចនៅលើអ៊ីនធឺណិត។ [2]
៣) ការធ្វើមាត្រដ្ឋានលក្ខណៈពិសេស និងការធ្វើឱ្យមានលក្ខណៈធម្មតា 📏
ការធ្វើមាត្រដ្ឋានមានសារៈសំខាន់ នៅពេលដែលលក្ខណៈពិសេសនានាស្ថិតនៅលើជួរខុសគ្នាខ្លាំង។.
បុរាណពីរ៖
-
ស្តង់ដារភាវូបនីយកម្ម ៖ ដកមធ្យមភាគចេញ និងធ្វើមាត្រដ្ឋានទៅជាភាពខុសគ្នានៃឯកតា [1]
-
ការធ្វើមាត្រដ្ឋានអប្បបរមា-អតិបរមា ៖ ធ្វើមាត្រដ្ឋានលក្ខណៈពិសេសនីមួយៗទៅក្នុងជួរដែលបានបញ្ជាក់ [1]
សូម្បីតែពេលអ្នកកំពុងប្រើម៉ូដែលដែល "ភាគច្រើនអាចទ្រាំទ្របាន" ក៏ដោយ ការធ្វើមាត្រដ្ឋានច្រើនតែធ្វើឱ្យបំពង់បង្ហូរប្រេងកាន់តែងាយស្រួលក្នុងការវែកញែក និងពិបាកក្នុងការបំបែកដោយចៃដន្យ។.
៤) វិស្វកម្មលក្ខណៈពិសេស (ហៅម្យ៉ាងទៀតថា ការបន្លំដែលមានប្រយោជន៍) 🧪
នេះជាកន្លែងដែលអ្នកធ្វើឱ្យការងាររបស់គំរូកាន់តែងាយស្រួលដោយបង្កើតសញ្ញាកាន់តែប្រសើរ៖
-
សមាមាត្រ (ចុច / ចំណាប់អារម្មណ៍)
-
បង្អួចរំកិល (N ថ្ងៃចុងក្រោយ)
-
ចំនួន (ព្រឹត្តិការណ៍ក្នុងមួយអ្នកប្រើប្រាស់)
-
ការបំលែងឡូហ្គោសម្រាប់ការចែកចាយកន្ទុយធ្ងន់
មានសិល្បៈមួយនៅទីនេះ។ ពេលខ្លះអ្នកនឹងបង្កើតមុខងារមួយ មានអារម្មណ៍មោទនភាព... ហើយវាមិនដំណើរការអ្វីទាំងអស់។ ឬអាក្រក់ជាងនេះទៅទៀត វាឈឺចាប់។ នោះជារឿងធម្មតា។ កុំភ្ជាប់អារម្មណ៍ទៅនឹងមុខងារ - ពួកគេមិនស្រឡាញ់អ្នកវិញទេ 😅
៥) ការបំបែកទិន្នន័យតាមរបៀបត្រឹមត្រូវ ✂️
នេះស្តាប់ទៅច្បាស់ណាស់រហូតដល់វាមិនមែនជា៖
-
ការបំបែកចៃដន្យសម្រាប់ទិន្នន័យ iid
-
ការបែងចែកផ្អែកលើពេលវេលាសម្រាប់ស៊េរីពេលវេលា
-
ការបំបែកជាក្រុមនៅពេលដែលអង្គភាពធ្វើម្តងទៀត (អ្នកប្រើប្រាស់ ឧបករណ៍ អ្នកជំងឺ)
ហើយសំខាន់ជាងនេះទៅទៀត៖ បំបែកមុនពេលសមសម្រាប់ការដំណើរការជាមុនដែលរៀនពីទិន្នន័យ ។ ប្រសិនបើជំហានដំណើរការជាមុនរបស់អ្នក "រៀន" ប៉ារ៉ាម៉ែត្រ (ដូចជាមធ្យោបាយ វាក្យសព្ទ ផែនទីប្រភេទ) វាត្រូវតែរៀនពួកវាពីការបណ្តុះបណ្តាលតែប៉ុណ្ណោះ។ [2]
ការដំណើរការជាមុនរបស់ AI តាមប្រភេទទិន្នន័យ៖ តារាង អត្ថបទ រូបភាព 🎛️
ការកែច្នៃជាមុនផ្លាស់ប្តូររូបរាងអាស្រ័យលើអ្វីដែលអ្នកបញ្ចូលគំរូ។.
ទិន្នន័យតារាង (សៀវភៅបញ្ជី កំណត់ហេតុ មូលដ្ឋានទិន្នន័យ) 📊
ជំហានទូទៅ៖
-
យុទ្ធសាស្ត្រតម្លៃដែលបាត់
-
ការអ៊ិនកូដប្រភេទ [1]
-
ការធ្វើមាត្រដ្ឋានជួរឈរលេខ [1]
-
ការដោះស្រាយ outlier (ច្បាប់ដូមេនល្អជាង "ការកាត់ចៃដន្យ" ភាគច្រើននៃពេលវេលា)
-
លក្ខណៈពិសេសដែលទទួលបាន (ការបូកសរុប ការយឺតយ៉ាវ ស្ថិតិរំកិល)
ដំបូន្មានជាក់ស្តែង៖ កំណត់ក្រុមជួរឈរឱ្យច្បាស់លាស់ (លេខ ទល់នឹង ប្រភេទ ទល់នឹង លេខសម្គាល់)។ អនាគតរបស់អ្នកនឹងអរគុណអ្នក។.
ទិន្នន័យអត្ថបទ (NLP) 📝
ការដំណើរការអត្ថបទជាមុនជារឿយៗរួមមាន៖
-
ការធ្វើសញ្ញាសម្គាល់ទៅជាសញ្ញាសម្គាល់/ពាក្យរង
-
ការបម្លែងទៅជា លេខសម្គាល់បញ្ចូល
-
ការបន្ថែម/ការកាត់ខ្លី
-
របាំងមុខ សម្រាប់បង្កើត សម្រាប់ការផលិតជាបាច់ [3]
ច្បាប់តូចមួយដែលជួយសន្សំសំចៃពេលវេលា៖ សម្រាប់ការដំឡើងដែលមានមូលដ្ឋានលើឧបករណ៍បំលែង សូមអនុវត្តតាមការកំណត់សញ្ញាសម្គាល់ដែលរំពឹងទុករបស់ម៉ូដែល ហើយកុំធ្វើរចនាប័ទ្មសេរី លុះត្រាតែអ្នកមានហេតុផល។ រចនាប័ទ្មសេរីគឺជារបៀបដែលអ្នកបញ្ចប់ដោយ "វាហ្វឹកហាត់ ប៉ុន្តែវាចម្លែក"។
រូបភាព (ចក្ខុវិស័យកុំព្យូទ័រ) 🖼️
ការកែច្នៃជាមុនធម្មតា៖
-
ប្ដូរទំហំ/កាត់ទៅជារាងដែលស៊ីសង្វាក់គ្នា
-
ការបំប្លែងកំណត់សម្រាប់ការវាយតម្លៃ
-
ការបំលែងចៃដន្យសម្រាប់ការបង្កើនការបណ្តុះបណ្តាល (ឧទាហរណ៍ ការច្រឹបចៃដន្យ) [4]
ចំណុចមួយដែលមនុស្សមើលរំលង៖ “ការបំលែងចៃដន្យ” មិនមែនគ្រាន់តែជាអារម្មណ៍មួយទេ - ពួកវាពិតជាយកគំរូប៉ារ៉ាម៉ែត្ររាល់ពេលដែលពួកគេត្រូវបានហៅ។ ល្អសម្រាប់ការបណ្តុះបណ្តាលភាពចម្រុះ ហើយអាក្រក់សម្រាប់ការវាយតម្លៃប្រសិនបើអ្នកភ្លេចបិទភាពចៃដន្យ។ [4]
អន្ទាក់ដែលមនុស្សគ្រប់គ្នាធ្លាក់ចូលទៅក្នុង៖ ការលេចធ្លាយទិន្នន័យ 🕳️🐍
ការលេចធ្លាយគឺជាពេលដែលព័ត៌មានពីទិន្នន័យវាយតម្លៃលួចចូលទៅក្នុងការបណ្តុះបណ្តាល - ជារឿយៗតាមរយៈការដំណើរការជាមុន។ វាអាចធ្វើឱ្យគំរូរបស់អ្នកមើលទៅអស្ចារ្យក្នុងអំឡុងពេលផ្ទៀងផ្ទាត់ ហើយបន្ទាប់មកធ្វើឱ្យអ្នកខកចិត្តនៅក្នុងពិភពពិត។.
លំនាំលេចធ្លាយទូទៅ៖
-
ការធ្វើមាត្រដ្ឋានដោយប្រើស្ថិតិសំណុំទិន្នន័យពេញលេញ (ជំនួសឱ្យការបណ្តុះបណ្តាលតែប៉ុណ្ណោះ) [2]
-
ការកសាងផែនទីប្រភេទដោយប្រើរថភ្លើង + សាកល្បងជាមួយគ្នា [2]
-
fit()ឬfit_transform()ណាមួយ ដែល "ឃើញ" សំណុំតេស្ត [2]
ច្បាប់សាមញ្ញ (សាមញ្ញ ឃោរឃៅ មានប្រសិទ្ធភាព)៖
-
អ្វីក៏ដោយដែលមាន ហាត់ប្រាណ គួរតែហាត់ប្រាណបានតែក្នុងពេលហ្វឹកហាត់ប៉ុណ្ណោះ។
-
បន្ទាប់មកអ្នក បំលែង ការផ្ទៀងផ្ទាត់/ការធ្វើតេស្តដោយប្រើឧបករណ៍បំលែងដែលបានបំពាក់នោះ។ [2]
ហើយប្រសិនបើអ្នកចង់បាន "តើវាអាចអាក្រក់ប៉ុណ្ណា?" ការត្រួតពិនិត្យពោះវៀន៖ ឯកសារផ្ទាល់ខ្លួនរបស់ scikit-learn បង្ហាញឧទាហរណ៍នៃការលេចធ្លាយដែលលំដាប់ដំណើរការជាមុនមិនត្រឹមត្រូវផ្តល់នូវភាពត្រឹមត្រូវប្រហែល 0.76 លើគោលដៅចៃដន្យ - បន្ទាប់មកធ្លាក់ចុះមក ~ 0.5 នៅពេលដែលការលេចធ្លាយត្រូវបានជួសជុល។ នោះហើយជារបៀបដែលការលេចធ្លាយខុសអាចមើលទៅ។ [2]
ដំណើរការនៃការកែច្នៃជាមុនចូលទៅក្នុងផលិតកម្មដោយគ្មានភាពវឹកវរ 🏗️
ម៉ូដែលជាច្រើនបរាជ័យក្នុងការផលិតមិនមែនដោយសារតែម៉ូដែលនេះ "អាក្រក់" នោះទេ ប៉ុន្តែដោយសារតែ ការពិតនៃការបញ្ចូល ផ្លាស់ប្តូរ - ឬដោយសារតែបំពង់បង្ហូររបស់អ្នកផ្លាស់ប្តូរ។
ការកែច្នៃជាមុនដែលគិតគូរពីផលិតកម្មជាធម្មតារួមមាន៖
-
វត្ថុបុរាណដែលបានរក្សាទុក (ការផ្គូផ្គងឧបករណ៍អ៊ិនកូដឌ័រ ប៉ារ៉ាម៉ែត្រមាត្រដ្ឋាន ការកំណត់រចនាសម្ព័ន្ធថូខិន) ដូច្នេះការសន្និដ្ឋានប្រើការបំលែងដែលបានរៀនដូចគ្នាបេះបិទ [2]
-
កិច្ចសន្យាបញ្ចូលតឹងរ៉ឹង (ជួរឈរ/ប្រភេទ/ជួរដែលរំពឹងទុក)
-
ការតាមដានសម្រាប់ភាពលំអៀង និងការរសាត់ ពីព្រោះទិន្នន័យផលិតកម្ម នឹង វង្វេង [5]
ប្រសិនបើអ្នកចង់បាននិយមន័យជាក់ស្តែង៖ ការត្រួតពិនិត្យគំរូ Vertex AI របស់ Google បែងចែក ភាពលំអៀងនៃការបម្រើការបណ្តុះបណ្តាល (ការចែកចាយផលិតកម្មខុសពីការបណ្តុះបណ្តាល) និង ការរសាត់នៃការសន្និដ្ឋាន (ការចែកចាយផលិតកម្មផ្លាស់ប្តូរតាមពេលវេលា) និងគាំទ្រការត្រួតពិនិត្យទាំងលក្ខណៈពិសេសប្រភេទ និងលេខ។ [5]
ពីព្រោះការភ្ញាក់ផ្អើលមានតម្លៃថ្លៃ។ ហើយមិនមែនជាប្រភេទសប្បាយនោះទេ។.
តារាងប្រៀបធៀប៖ ឧបករណ៍ដំណើរការជាមុន + ឧបករណ៍ត្រួតពិនិត្យទូទៅ (និងឧបករណ៍ទាំងនោះសម្រាប់អ្នកណា) 🧰
| ឧបករណ៍/បណ្ណាល័យ | ល្អបំផុតសម្រាប់ | តម្លៃ | ហេតុអ្វីបានជាវាដំណើរការ (និងភាពស្មោះត្រង់បន្តិចបន្តួច) |
|---|---|---|---|
| ការដំណើរការជាមុនរបស់ scikit-learn | បំពង់ ML តារាង | ឥតគិតថ្លៃ | ឧបករណ៍អ៊ិនកូដឌ័ររឹង + ឧបករណ៍ធ្វើមាត្រដ្ឋាន (OneHotEncoder, StandardScaler ជាដើម) និងឥរិយាបថដែលអាចព្យាករណ៍បាន [1] |
| ឧបករណ៍បង្កើតសញ្ញាសម្គាល់មុខឱប | ការរៀបចំការបញ្ចូល NLP | ឥតគិតថ្លៃ | បង្កើតលេខសម្គាល់បញ្ចូល + របាំងយកចិត្តទុកដាក់ជាប់លាប់នៅទូទាំងការរត់/ម៉ូដែល [3] |
| ការផ្លាស់ប្តូរ Torchvision | ការផ្លាស់ប្តូរចក្ខុវិស័យ + ការបង្កើន | ឥតគិតថ្លៃ | វិធីស្អាតដើម្បីលាយបញ្ចូលគ្នានូវការបំលែងកំណត់ និងចៃដន្យនៅក្នុងបំពង់បង្ហូរតែមួយ [4] |
| ការត្រួតពិនិត្យម៉ូដែល Vertex AI | ការរកឃើញភាពរសាត់/ភាពលំអៀងនៅក្នុងផលិតផល | បានបង់ប្រាក់ (ពពក) | ម៉ូនីទ័រមានលក្ខណៈពិសេសនៃការលំអៀង/ការរសាត់ និងការជូនដំណឹងនៅពេលដែលកម្រិតកំណត់ត្រូវបានលើស [5] |
(មែនហើយ តារាងនេះនៅតែមានមតិយោបល់។ ប៉ុន្តែយ៉ាងហោចណាស់វាជាមតិយោបល់ស្មោះត្រង់ 😅)
បញ្ជីត្រួតពិនិត្យមុនដំណើរការជាក់ស្តែងដែលអ្នកពិតជាអាចប្រើប្រាស់បាន📌
មុនពេលហ្វឹកហាត់
-
កំណត់គ្រោងការណ៍បញ្ចូល (ប្រភេទ ឯកតា ជួរដែលអនុញ្ញាត)
-
ត្រួតពិនិត្យតម្លៃដែលបាត់ និងតម្លៃស្ទួន
-
បំបែកទិន្នន័យតាមវិធីត្រឹមត្រូវ (ចៃដន្យ / ផ្អែកលើពេលវេលា / ដាក់ជាក្រុម)
-
ការដំណើរការជាមុននៃ Fit លើ ការហ្វឹកហាត់តែប៉ុណ្ណោះ (
fit/fit_transformនៅតែដំណើរការ) [2] -
រក្សាទុកវត្ថុបុរាណដែលដំណើរការជាមុន ដូច្នេះការសន្និដ្ឋានអាចប្រើប្រាស់វាឡើងវិញបាន [2]
អំឡុងពេលហ្វឹកហាត់
-
អនុវត្តការបង្កើនដោយចៃដន្យតែនៅកន្លែងដែលសមស្រប (ជាធម្មតាការបំបែកការបណ្តុះបណ្តាលតែប៉ុណ្ណោះ) [4]
-
រក្សាការវាយតម្លៃជាមុនឱ្យមានលក្ខណៈកំណត់ [4]
-
តាមដានការផ្លាស់ប្តូរមុនដំណើរការដូចជាការផ្លាស់ប្តូរគំរូ (ពីព្រោះវាជា)
មុនពេលដាក់ពង្រាយ
-
ត្រូវប្រាកដថាការសន្និដ្ឋានប្រើផ្លូវដំណើរការមុន និងវត្ថុបុរាណដូចគ្នា [2]
-
រៀបចំការត្រួតពិនិត្យការរសាត់/ភាពលំអៀង (សូម្បីតែការត្រួតពិនិត្យការចែកចាយមុខងារជាមូលដ្ឋានក៏មានប្រសិទ្ធភាពខ្ពស់ដែរ) [5]
ស្វែងយល់ឲ្យស៊ីជម្រៅ៖ កំហុសឆ្គងទូទៅនៃការដំណើរការមុន (និងវិធីជៀសវាងវា) 🧯
កំហុសទី 1: "ខ្ញុំនឹងធ្វើឱ្យអ្វីៗគ្រប់យ៉ាងមានលក្ខណៈធម្មតាឡើងវិញយ៉ាងឆាប់រហ័ស" 😵
ប្រសិនបើអ្នកគណនាប៉ារ៉ាម៉ែត្រធ្វើមាត្រដ្ឋាននៅលើសំណុំទិន្នន័យពេញលេញ អ្នកកំពុងលេចធ្លាយព័ត៌មានវាយតម្លៃ។ សមនឹងរថភ្លើង បំលែងអ្វីដែលនៅសល់។ [2]
កំហុសទី 2: ប្រភេទសត្វកំពុងរសាត់ទៅក្នុងភាពវឹកវរ 🧩
ប្រសិនបើការគូសផែនទីប្រភេទរបស់អ្នកផ្លាស់ប្តូររវាងការហ្វឹកហ្វឺន និងការសន្និដ្ឋាន គំរូរបស់អ្នកអាចអានពិភពលោកខុសដោយស្ងៀមស្ងាត់។ រក្សាការគូសផែនទីឱ្យថេរតាមរយៈវត្ថុបុរាណដែលបានរក្សាទុក។ [2]
កំហុសទី 3: ការបង្កើនដោយចៃដន្យលួចចូលទៅក្នុងការវាយតម្លៃ 🎲
ការបំលែងចៃដន្យគឺអស្ចារ្យណាស់នៅក្នុងការហ្វឹកហាត់ ប៉ុន្តែវាមិនគួរត្រូវបាន "បើកដោយសម្ងាត់" នៅពេលអ្នកកំពុងព្យាយាមវាស់ស្ទង់ការអនុវត្តនោះទេ។ (ចៃដន្យមានន័យថាចៃដន្យ។) [4]
កំណត់ចំណាំចុងក្រោយ🧠✨
ការកែច្នៃជាមុនដោយ AI គឺជាសិល្បៈដែលមានវិន័យក្នុងការប្រែក្លាយការពិតដ៏រញ៉េរញ៉ៃទៅជាធាតុចូលគំរូដែលស៊ីសង្វាក់គ្នា។ វាគ្របដណ្តប់លើការសម្អាត ការអ៊ិនកូដ ការធ្វើមាត្រដ្ឋាន ការធ្វើសញ្ញាសម្ងាត់ ការបំលែងរូបភាព និងសំខាន់បំផុតគឺបំពង់បង្ហូរទិន្នន័យ និងវត្ថុបុរាណដែលអាចធ្វើម្តងទៀត។
-
ធ្វើការកែច្នៃជាមុនដោយចេតនា មិនមែនដោយចៃដន្យទេ។ [2]
-
បំបែកជាមុនសិន ការផ្លាស់ប្តូររូបរាងសមល្មមសម្រាប់ការហ្វឹកហាត់តែប៉ុណ្ណោះ ជៀសវាងការលេចធ្លាយ។ [2]
-
ប្រើការដំណើរការជាមុនដែលសមស្របតាមម៉ូឌុល (សញ្ញាសម្គាល់សម្រាប់អត្ថបទ ការបំលែងសម្រាប់រូបភាព)។ [3][4]
-
តាមដានភាពលំអៀង/ការរសាត់នៃផលិតកម្ម ដើម្បីកុំឱ្យគំរូរបស់អ្នករសាត់បន្តិចម្តងៗទៅជារឿងមិនសមហេតុផល។ [5]
ហើយប្រសិនបើអ្នកធ្លាប់ជាប់គាំង សូមសួរខ្លួនឯងថា
“តើជំហានដំណើរការជាមុននេះនៅតែសមហេតុផលទេ ប្រសិនបើខ្ញុំដំណើរការវានៅថ្ងៃស្អែកលើទិន្នន័យថ្មី?”
ប្រសិនបើចម្លើយគឺ “អឺ… ប្រហែលជា?” នោះជាតម្រុយរបស់អ្នក 😬
សំណួរដែលសួរញឹកញាប់
តើការដំណើរការជាមុនរបស់ AI និយាយឲ្យសាមញ្ញទៅជាអ្វី?
ការដំណើរការជាមុនរបស់ AI គឺជាសំណុំជំហានដែលអាចធ្វើម្តងទៀតបាន ដែលប្រែក្លាយទិន្នន័យឆៅដែលមានសំឡេងរំខាន និងមានភាពប្រែប្រួលខ្ពស់ទៅជាធាតុចូលដែលស៊ីសង្វាក់គ្នា ដែលគំរូអាចរៀនបាន។ វាអាចរួមបញ្ចូលការសម្អាត ការផ្ទៀងផ្ទាត់ ការអ៊ិនកូដប្រភេទ ការធ្វើមាត្រដ្ឋានតម្លៃលេខ ការធ្វើសញ្ញាសម្ងាត់អត្ថបទ និងការអនុវត្តការបំលែងរូបភាព។ គោលដៅគឺដើម្បីធានាថាការបណ្តុះបណ្តាល និងការសន្និដ្ឋានផលិតកម្មមើលឃើញធាតុចូល "ប្រភេទដូចគ្នា" ដូច្នេះគំរូមិនរសាត់ទៅក្នុងឥរិយាបថដែលមិនអាចទាយទុកជាមុនបាននៅពេលក្រោយ។.
ហេតុអ្វីបានជាការកែច្នៃជាមុនរបស់ AI មានសារៈសំខាន់ខ្លាំងម្ល៉េះនៅក្នុងផលិតកម្ម?
ការដំណើរការជាមុនមានសារៈសំខាន់ ពីព្រោះគំរូងាយនឹងរងផលប៉ះពាល់ដោយការតំណាងធាតុចូល។ ប្រសិនបើទិន្នន័យបណ្តុះបណ្តាលត្រូវបានធ្វើមាត្រដ្ឋាន អ៊ិនកូដ ធ្វើជាថូខឹន ឬបំលែងខុសពីទិន្នន័យផលិតកម្ម អ្នកអាចទទួលបានការបរាជ័យនៃការមិនស៊ីគ្នានៃការហ្វឹកហាត់/បម្រើ ដែលមើលទៅល្អនៅក្រៅបណ្តាញ ប៉ុន្តែបរាជ័យយ៉ាងស្ងៀមស្ងាត់នៅលើបណ្តាញ។ បំពង់ដំណើរការជាមុនដ៏រឹងមាំក៏កាត់បន្ថយសំឡេងរំខាន ធ្វើអោយប្រសើរឡើងនូវស្ថេរភាពនៃការរៀនសូត្រ និងបង្កើនល្បឿននៃការធ្វើម្តងទៀត ពីព្រោះអ្នកមិនកំពុងស្រាយស្ប៉ាហ្គេតទីសៀវភៅកត់ត្រាដែលច្របូកច្របល់នោះទេ។.
តើខ្ញុំធ្វើដូចម្តេចដើម្បីជៀសវាងការលេចធ្លាយទិន្នន័យនៅពេលដំណើរការជាមុន?
ច្បាប់សាមញ្ញមួយដំណើរការ៖ អ្វីក៏ដោយដែលមាន សម ត្រូវតែសមលើទិន្នន័យបណ្តុះបណ្តាលតែប៉ុណ្ណោះ។ នោះរួមបញ្ចូលទាំងឧបករណ៍ធ្វើមាត្រដ្ឋាន ឧបករណ៍អ៊ិនកូដឌ័រ និងឧបករណ៍ចាប់សញ្ញាដែលរៀនប៉ារ៉ាម៉ែត្រដូចជាមធ្យម ផែនទីប្រភេទ ឬវាក្យសព្ទ។ អ្នកបំបែកជាមុនសិន សមលើការបែងចែកការបណ្តុះបណ្តាល បន្ទាប់មកបំលែងការផ្ទៀងផ្ទាត់/សាកល្បងដោយប្រើឧបករណ៍បំលែងដែលបានបំពាក់។ ការលេចធ្លាយអាចធ្វើឱ្យការផ្ទៀងផ្ទាត់មើលទៅល្អ "ដោយអព្ភូតហេតុ" ហើយបន្ទាប់មកដួលរលំក្នុងការប្រើប្រាស់ផលិតកម្ម។
តើជំហានមុនដំណើរការទូទៅបំផុតសម្រាប់ទិន្នន័យតារាងមានអ្វីខ្លះ?
សម្រាប់ទិន្នន័យតារាង បំពង់បង្ហូរទិន្នន័យធម្មតារួមមានការសម្អាត និងការផ្ទៀងផ្ទាត់ (ប្រភេទ ជួរ តម្លៃដែលបាត់) ការអ៊ិនកូដប្រភេទ (មួយក្តៅ ឬលំដាប់) និងការធ្វើមាត្រដ្ឋានលេខ (ស្តង់ដារភាវូបនីយកម្ម ឬអប្បបរមា-អតិបរមា)។ បំពង់បង្ហូរទិន្នន័យជាច្រើនបន្ថែមវិស្វកម្មលក្ខណៈពិសេសដែលជំរុញដោយដែនដូចជាសមាមាត្រ បង្អួចរំកិល ឬការរាប់។ ទម្លាប់ជាក់ស្តែងមួយគឺត្រូវកំណត់ក្រុមជួរឈរឱ្យច្បាស់លាស់ (លេខ ទល់នឹង ប្រភេទ ទល់នឹង ឧបករណ៍កំណត់អត្តសញ្ញាណ) ដូច្នេះការបំលែងរបស់អ្នកនៅតែស៊ីសង្វាក់គ្នា។.
តើការដំណើរការជាមុនដំណើរការយ៉ាងដូចម្តេចសម្រាប់គំរូអត្ថបទ?
ការដំណើរការអត្ថបទជាមុនជាធម្មតាមានន័យថា ការធ្វើសញ្ញាសម្ងាត់ទៅជាសញ្ញាសម្ងាត់/ពាក្យរង បំលែងវាទៅជាលេខសម្គាល់ធាតុចូល និងដោះស្រាយការបន្ថែម/កាត់សម្រាប់ការបាច់។ លំហូរការងាររបស់ឧបករណ៍បំលែងជាច្រើនក៏បង្កើតរបាំងយកចិត្តទុកដាក់រួមជាមួយលេខសម្គាល់ផងដែរ។ វិធីសាស្រ្តទូទៅមួយគឺត្រូវប្រើការកំណត់រចនាសម្ព័ន្ធសញ្ញាសម្ងាត់ដែលរំពឹងទុករបស់គំរូជាជាងការកែលម្អ ពីព្រោះភាពខុសគ្នាតិចតួចនៅក្នុងការកំណត់សញ្ញាសម្ងាត់អាចនាំឱ្យមានលទ្ធផល "វាហ្វឹកហាត់ ប៉ុន្តែវាមានឥរិយាបទមិនអាចទាយទុកជាមុនបាន"។.
តើមានអ្វីខុសគ្នាអំពីការដំណើរការរូបភាពជាមុនសម្រាប់ការរៀនរបស់ម៉ាស៊ីន?
ការកែច្នៃរូបភាពជាមុនជាធម្មតាធានានូវរូបរាង និងការគ្រប់គ្រងភីកសែលដែលមានភាពស៊ីសង្វាក់គ្នា៖ ការផ្លាស់ប្តូរទំហំ/ការច្រឹប ការធ្វើឱ្យមានលក្ខណៈធម្មតា និងការបែងចែកច្បាស់លាស់រវាងការបំលែងកំណត់ និងការបំលែងចៃដន្យ។ សម្រាប់ការវាយតម្លៃ ការបំលែងគួរតែកំណត់ ដើម្បីឱ្យម៉ែត្រអាចប្រៀបធៀបបាន។ សម្រាប់ការហ្វឹកហ្វឺន ការបង្កើនចៃដន្យ (ដូចជាការច្រឹបចៃដន្យ) អាចធ្វើអោយប្រសើរឡើងនូវភាពរឹងមាំ ប៉ុន្តែភាពចៃដន្យត្រូវតែត្រូវបានកំណត់វិសាលភាពដោយចេតនាចំពោះការបំបែកការហ្វឹកហ្វឺន មិនមែនទុកចោលដោយចៃដន្យក្នុងអំឡុងពេលវាយតម្លៃនោះទេ។.
តើអ្វីទៅដែលធ្វើឱ្យបំពង់ដំណើរការមុនដំណើរការ "ល្អ" ជំនួសឱ្យការផុយស្រួយ?
បំពង់ដំណើរការមុននៃ AI ដ៏ល្អមួយគឺអាចបង្កើតឡើងវិញបាន មានសុវត្ថិភាពក្នុងការលេចធ្លាយ និងអាចសង្កេតឃើញ។ អាចបង្កើតឡើងវិញបានមានន័យថា ការបញ្ចូលដូចគ្នាបង្កើតទិន្នផលដូចគ្នា លុះត្រាតែភាពចៃដន្យគឺជាការបង្កើនដោយចេតនា។ សុវត្ថិភាពក្នុងការលេចធ្លាយមានន័យថា ជំហានសមស្របមិនដែលប៉ះនឹងការផ្ទៀងផ្ទាត់/ការធ្វើតេស្តឡើយ។ អាចសង្កេតឃើញមានន័យថា អ្នកអាចត្រួតពិនិត្យស្ថិតិដូចជាការបាត់ ចំនួនប្រភេទ និងការចែកចាយលក្ខណៈពិសេស ដូច្នេះការបំបាត់កំហុសគឺផ្អែកលើភស្តុតាង មិនមែនអារម្មណ៍ពិតនោះទេ។ បំពង់បង្ហូរទិន្នន័យយកឈ្នះលើលំដាប់សៀវភៅកត់ត្រា ad-hoc រាល់ពេល។.
តើខ្ញុំធ្វើដូចម្តេចដើម្បីរក្សាការហ្វឹកហ្វឺន និងការសន្និដ្ឋានជាមុនឲ្យមានភាពស៊ីសង្វាក់គ្នា?
ចំណុចសំខាន់គឺត្រូវប្រើឡើងវិញនូវវត្ថុបុរាណដែលបានរៀនដូចគ្នាបេះបិទនៅពេលសន្និដ្ឋាន៖ ប៉ារ៉ាម៉ែត្រ scaler ការផ្គូផ្គង encoder និងការកំណត់រចនាសម្ព័ន្ធ tokenizer។ អ្នកក៏ចង់បានកិច្ចសន្យាបញ្ចូល (ជួរឈរ ប្រភេទ និងជួរដែលរំពឹងទុក) ដូច្នេះទិន្នន័យផលិតកម្មមិនអាចរសាត់ទៅក្នុងរាងមិនត្រឹមត្រូវដោយស្ងៀមស្ងាត់បានទេ។ ភាពស៊ីសង្វាក់គ្នាមិនមែនគ្រាន់តែ "ធ្វើជំហានដូចគ្នា" នោះទេ - វាគឺជា "ធ្វើជំហានដូចគ្នាជាមួយនឹងប៉ារ៉ាម៉ែត្រ និងការផ្គូផ្គងដែលបានដំឡើងដូចគ្នា"។
តើខ្ញុំអាចតាមដានបញ្ហាដំណើរការមុនដូចជាការរសាត់ និងភាពលំអៀងតាមពេលវេលាដោយរបៀបណា?
ទោះបីជាមានបំពង់បង្ហូរទិន្នន័យរឹងមាំក៏ដោយ ទិន្នន័យផលិតកម្មនៅតែផ្លាស់ប្តូរ។ វិធីសាស្រ្តទូទៅមួយគឺតាមដានការផ្លាស់ប្តូរការចែកចាយលក្ខណៈពិសេស និងជូនដំណឹងអំពីភាពលំអៀងនៃការបម្រើការបណ្តុះបណ្តាល (ផលិតកម្មងាកចេញពីការបណ្តុះបណ្តាល) និងការរសាត់នៃការសន្និដ្ឋាន (ការផ្លាស់ប្តូរផលិតកម្មតាមពេលវេលា)។ ការត្រួតពិនិត្យអាចមានទម្ងន់ស្រាល (ការត្រួតពិនិត្យការចែកចាយជាមូលដ្ឋាន) ឬគ្រប់គ្រង (ដូចជាការត្រួតពិនិត្យគំរូ Vertex AI)។ គោលដៅគឺដើម្បីចាប់យកការផ្លាស់ប្តូរធាតុចូលឱ្យបានឆាប់ - មុនពេលពួកវាធ្វើឱ្យខូចដំណើរការគំរូបន្តិចម្តងៗ។.
ឯកសារយោង
[1] API scikit-learn៖
sklearn.preprocessing (កម្មវិធីអ៊ិនកូដឌ័រ ស្កែល័រ ការធ្វើឱ្យមានលក្ខណៈធម្មតា) [2] scikit-learn៖ កំហុសទូទៅ - ការលេចធ្លាយទិន្នន័យ និងវិធីជៀសវាងវា
[3] ឯកសារ Hugging Face Transformers៖ Tokenizers (លេខសម្គាល់បញ្ចូល របាំងយកចិត្តទុកដាក់)
[4] ឯកសារ PyTorch Torchvision៖ ការបំលែង (ប្តូរទំហំ/ធ្វើឱ្យមានលក្ខណៈធម្មតា + ការបំលែងចៃដន្យ)
[5] ឯកសារ Google Cloud Vertex AI៖ ទិដ្ឋភាពទូទៅនៃការត្រួតពិនិត្យគំរូ (ភាពលំអៀង និងរសាត់នៃលក្ខណៈពិសេស)