តើ​ការ​ដំណើរការ​ជាមុន​ដោយ AI ជា​អ្វី?

តើ​ការ​ដំណើរការ​ជាមុន​ដោយ AI ជា​អ្វី?

ចម្លើយខ្លី៖ ការដំណើរការជាមុនរបស់ AI គឺជាសំណុំនៃជំហានដែលអាចធ្វើម្តងទៀតបាន ដែលប្រែក្លាយទិន្នន័យឆៅ និងមានភាពប្រែប្រួលខ្ពស់ទៅជាការបញ្ចូលគំរូដែលស៊ីសង្វាក់គ្នា រួមទាំងការសម្អាត ការអ៊ិនកូដ ការធ្វើមាត្រដ្ឋាន ការធ្វើសញ្ញាសម្ងាត់ និងការបំលែងរូបភាព។ វាសំខាន់ណាស់ ពីព្រោះប្រសិនបើការបញ្ចូលការបណ្តុះបណ្តាល និងការបញ្ចូលផលិតកម្មខុសគ្នា គំរូអាចបរាជ័យដោយស្ងៀមស្ងាត់។ ប្រសិនបើជំហានមួយ "រៀន" ប៉ារ៉ាម៉ែត្រ សូមដាក់វានៅលើទិន្នន័យបណ្តុះបណ្តាលតែប៉ុណ្ណោះ ដើម្បីជៀសវាងការលេចធ្លាយ។

ការដំណើរការជាមុនរបស់ AI គឺជាអ្វីគ្រប់យ៉ាងដែលអ្នកធ្វើចំពោះទិន្នន័យឆៅមុន (ហើយជួនកាលក្នុងអំឡុងពេល) ការបណ្តុះបណ្តាល ឬការសន្និដ្ឋាន ដូច្នេះគំរូមួយអាចរៀនពីវាបាន។ មិនមែនគ្រាន់តែជា "ការសម្អាត" នោះទេ។ វាគឺជាការសម្អាត ការបង្កើតរូបរាង ការធ្វើមាត្រដ្ឋាន ការអ៊ិនកូដ ការបង្កើន និងការវេចខ្ចប់ទិន្នន័យទៅជាតំណាងដែលស៊ីសង្វាក់គ្នា ដែលនឹងមិនធ្វើឱ្យគំរូរបស់អ្នកមានបញ្ហានៅពេលក្រោយឡើយ។ [1]

ចំណុចសំខាន់ៗ៖

និយមន័យ ៖ ការ​ដំណើរការ​ជាមុន​បម្លែង​តារាង​ឆៅ អត្ថបទ រូបភាព និង​កំណត់ហេតុ​ទៅជា​មុខងារ​ដែល​ត្រៀម​សម្រាប់​ធ្វើ​គំរូ។

ភាពស៊ីសង្វាក់គ្នា ៖ អនុវត្តការបំលែងដូចគ្នាក្នុងអំឡុងពេលហ្វឹកហាត់ និងការសន្និដ្ឋាន ដើម្បីការពារការបរាជ័យនៃភាពមិនស៊ីសង្វាក់គ្នា។

ការលេចធ្លាយ ៖ ដំឡើងឧបករណ៍ធ្វើមាត្រដ្ឋាន ឧបករណ៍អ៊ិនកូដឌ័រ និងឧបករណ៍ចាប់សញ្ញាលើទិន្នន័យហ្វឹកហាត់តែប៉ុណ្ណោះ។

សមត្ថភាព​ផលិត​ឡើង​វិញ ៖ បង្កើត​បំពង់​បង្ហូរ​ទិន្នន័យ​ជាមួយ​នឹង​ស្ថិតិ​ដែល​អាច​ត្រួតពិនិត្យ​បាន មិនមែន​លំដាប់​ក្រឡា​សៀវភៅ​កត់ត្រា​បែប​ពិសេស​ទេ។

ការត្រួតពិនិត្យផលិតកម្ម ៖ តាមដានភាពលំអៀង និងការរសាត់ ដើម្បីកុំឱ្យធាតុចូលធ្វើឱ្យប៉ះពាល់ដល់ដំណើរការបន្តិចម្តងៗ។

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 របៀបសាកល្បងគំរូ AI សម្រាប់ដំណើរការក្នុងពិភពពិត
វិធីសាស្រ្តជាក់ស្តែងដើម្បីវាយតម្លៃភាពត្រឹមត្រូវ ភាពរឹងមាំ និងភាពលំអៀងយ៉ាងឆាប់រហ័ស។.

🔗 តើ AI បំលែងអត្ថបទទៅជាការនិយាយជាអត្ថបទឬអត់ ហើយវាដំណើរការយ៉ាងដូចម្តេច?
ពន្យល់ពីមូលដ្ឋានគ្រឹះ TTS ការប្រើប្រាស់សំខាន់ៗ និងដែនកំណត់ទូទៅនាពេលបច្ចុប្បន្ន។.

🔗 តើ AI អាចអានការសរសេរដោយដៃបានត្រឹមត្រូវនៅថ្ងៃនេះទេ?
គ្របដណ្តប់លើបញ្ហាប្រឈមនៃការទទួលស្គាល់ ឧបករណ៍ល្អបំផុត និងគន្លឹះភាពត្រឹមត្រូវ។.

🔗 តើ AI មានភាពត្រឹមត្រូវប៉ុណ្ណានៅទូទាំងភារកិច្ចទូទៅ
បំបែកកត្តាភាពត្រឹមត្រូវ ស្តង់ដារ និងភាពជឿជាក់ក្នុងពិភពពិត។.


ការដំណើរការជាមុនរបស់ AI ជាភាសាសាមញ្ញ (និងអ្វីដែលវាមិនមែន) 🤝

ការកែច្នៃជាមុនដោយ AI គឺជាការបំលែងធាតុចូលឆៅ (តារាង អត្ថបទ រូបភាព កំណត់ហេតុ) ទៅជាលក្ខណៈពិសេសដែលត្រៀមរួចជាស្រេចសម្រាប់ម៉ូដែល។ ប្រសិនបើទិន្នន័យឆៅគឺជាយានដ្ឋានដ៏រញ៉េរញ៉ៃ ការកែច្នៃជាមុនគឺអ្នកដាក់ស្លាកលើប្រអប់ បោះសំរាមដែលខូច និងដាក់របស់របរជាជង់ៗ ដើម្បីឱ្យអ្នកអាចដើរឆ្លងកាត់ដោយគ្មានរបួស។

វាមិនមែនជាគំរូខ្លួនឯងទេ។ វាជារបស់ដែលធ្វើឱ្យគំរូអាចធ្វើទៅបាន៖

  • ការប្រែក្លាយប្រភេទទៅជាលេខ (មួយ-ក្តៅ លំដាប់ ជាដើម) [1]

  • ការធ្វើមាត្រដ្ឋានជួរលេខធំៗទៅជាជួរសមហេតុផល (ស្តង់ដារភាវូបនីយកម្ម អប្បបរមា-អតិបរមា ជាដើម) [1]

  • ការ​ធ្វើ​សញ្ញា​សម្គាល់​អត្ថបទ​ទៅ​ក្នុង​លេខ​សម្គាល់​ការ​បញ្ចូល (ហើយ​ជា​ធម្មតា​ជា​របាំង​ការ​យកចិត្តទុកដាក់) [3]

  • ការផ្លាស់ប្តូរទំហំ/ការច្រឹបរូបភាព និងការអនុវត្តការបំលែងកំណត់ទល់នឹងការបំលែងចៃដន្យឲ្យបានត្រឹមត្រូវ [4]

  • ការកសាងបំពង់បង្ហូរទិន្នន័យដែលអាចធ្វើម្តងទៀតបាន ដូច្នេះការបណ្តុះបណ្តាល និងធាតុចូល "ជីវិតពិត" មិនខុសគ្នាតាមរបៀបស្រទន់ [2]

កំណត់ចំណាំជាក់ស្តែងតូចមួយ៖ “ការដំណើរការជាមុន” រួមបញ្ចូល អ្វីដែលកើតឡើងជាប់លាប់មុនពេលគំរូឃើញធាតុចូល ។ ក្រុមខ្លះបែងចែករឿងនេះទៅជា “វិស្វកម្មលក្ខណៈពិសេស” ទល់នឹង “ការសម្អាតទិន្នន័យ” ប៉ុន្តែក្នុងជីវិតពិត ខ្សែបន្ទាត់ទាំងនោះមិនច្បាស់លាស់។

 

ការដំណើរការជាមុនរបស់ AI

ហេតុអ្វីបានជាការកែច្នៃជាមុនរបស់ AI មានសារៈសំខាន់ជាងអ្វីដែលមនុស្សទទួលស្គាល់ 😬

គំរូគឺជាឧបករណ៍ផ្គូផ្គងគំរូ មិនមែនជាឧបករណ៍អានគំនិតទេ។ ប្រសិនបើធាតុចូលរបស់អ្នកមិនស៊ីសង្វាក់គ្នា គំរូនឹងរៀនច្បាប់មិនស៊ីសង្វាក់គ្នា។ នោះមិនមែនជាទស្សនវិជ្ជាទេ វាជារឿងត្រង់ៗ។.

ការកែច្នៃជាមុនជួយអ្នក៖

  • បង្កើនស្ថេរភាពនៃការរៀនសូត្រ ដោយដាក់លក្ខណៈពិសេសទៅក្នុងការតំណាងដែលអ្នកប៉ាន់ស្មានអាចប្រើប្រាស់បានដោយភាពជឿជាក់ (ជាពិសេសនៅពេលដែលមានជាប់ពាក់ព័ន្ធនឹងការធ្វើមាត្រដ្ឋាន/ការអ៊ិនកូដ)។ [1]

  • កាត់បន្ថយសំឡេងរំខាន ដោយធ្វើឱ្យការពិតដ៏រញ៉េរញ៉ៃមើលទៅដូចជាអ្វីមួយដែលតារាម៉ូដែលអាចធ្វើឱ្យមានលក្ខណៈទូទៅ (ជំនួសឱ្យការទន្ទេញចាំវត្ថុបុរាណចម្លែកៗ)។

  • ការពាររបៀបបរាជ័យស្ងាត់ៗ ដូចជាការលេចធ្លាយ និងការហ្វឹកហាត់/ការបម្រើមិនត្រូវគ្នា (ប្រភេទដែលមើលទៅ "អស្ចារ្យ" នៅក្នុងការផ្ទៀងផ្ទាត់ ហើយបន្ទាប់មកបិទបាំងនៅក្នុងផលិតកម្ម)។ [2]

  • បង្កើនល្បឿនការធ្វើម្តងទៀត ពីព្រោះការធ្វើម្តងទៀតអាចបំលែងចង្វាក់របស់ស្ប៉ាហ្គេទីក្នុងសៀវភៅកត់ត្រាជារៀងរាល់ថ្ងៃនៃសប្តាហ៍។

ម្យ៉ាងទៀត វាជាកន្លែងដែល «ការសម្តែងជាគំរូ» ជាច្រើនពិតជាមកពី។ ដូចជា… គួរឱ្យភ្ញាក់ផ្អើលណាស់។ ពេលខ្លះវាមានអារម្មណ៍ថាអយុត្តិធម៌ ប៉ុន្តែនោះជាការពិត 🙃


អ្វីដែលធ្វើឱ្យបំពង់បង្ហូរដំណើរការមុន AI ល្អ ✅

“កំណែល្អ” នៃការកែច្នៃជាមុនជាធម្មតាមានគុណសម្បត្តិទាំងនេះ៖

  • អាចផលិតឡើងវិញបាន ៖ ការបញ្ចូលដូចគ្នា → លទ្ធផលដូចគ្នា (គ្មានភាពចៃដន្យអាថ៌កំបាំងទេ លុះត្រាតែវាជាការបង្កើនដោយចេតនា)។

  • ភាពស៊ីសង្វាក់គ្នានៃការបម្រើរថភ្លើង ៖ អ្វីក៏ដោយដែលអ្នកធ្វើនៅពេលហ្វឹកហាត់ត្រូវបានអនុវត្តតាមវិធីដូចគ្នានៅពេលសន្និដ្ឋាន (ប៉ារ៉ាម៉ែត្រដែលបានដំឡើងដូចគ្នា ផែនទីប្រភេទដូចគ្នា ការកំណត់រចនាសម្ព័ន្ធសញ្ញាសម្គាល់ដូចគ្នា ។ល។)។ [2]

  • មានសុវត្ថិភាពសម្រាប់ការលេចធ្លាយ ៖ គ្មានអ្វីនៅក្នុងការវាយតម្លៃ/ការធ្វើតេស្តដែលមានឥទ្ធិពលលើ សមស្រប ។ (ព័ត៌មានបន្ថែមអំពីអន្ទាក់នេះនៅពេលក្រោយ។) [2]

  • អាចសង្កេតបាន ៖ អ្នកអាចត្រួតពិនិត្យអ្វីដែលបានផ្លាស់ប្តូរ (ស្ថិតិលក្ខណៈពិសេស ការបាត់ ចំនួនប្រភេទ) ដូច្នេះការបំបាត់កំហុសមិនមែនជាវិស្វកម្មដែលផ្អែកលើ vibes ទេ។

ប្រសិនបើការដំណើរការជាមុនរបស់អ្នកគឺជាគំនរក្រឡាសៀវភៅកត់ត្រាដែលមានឈ្មោះថា final_v7_really_final_ok … អ្នកដឹងពីរបៀបដែលវាដំណើរការ។ វាដំណើរការរហូតដល់វាមិនដំណើរការ 😬


ប្លុកសំណង់ស្នូលនៃការដំណើរការជាមុនរបស់ AI 🧱

សូមគិតអំពីការដំណើរការជាមុនដូចជាសំណុំនៃប្លុកសំណង់ដែលអ្នកបញ្ចូលទៅក្នុងបំពង់បង្ហូរ។.

១) ការសម្អាត និងការផ្ទៀងផ្ទាត់ 🧼

ភារកិច្ចធម្មតា៖

  • លុប​ច្បាប់​ចម្លង​ចេញ

  • ដោះស្រាយតម្លៃដែលបាត់ (ទម្លាក់ បញ្ចូល ឬតំណាងឱ្យការបាត់ដោយច្បាស់លាស់)

  • អនុវត្តប្រភេទ ឯកតា និងជួរ

  • រកឃើញ​ធាតុ​បញ្ចូល​ដែល​មាន​ទម្រង់​មិន​ត្រឹមត្រូវ

  • ធ្វើ​ឲ្យ​មាន​ស្តង់ដារ​ទ្រង់ទ្រាយ​អត្ថបទ (ចន្លោះ​ទទេ ច្បាប់​អក្សរ​ធំ ភាព​ខុស​គ្នា​នៃ​អក្សរ​យូនីកូដ)

ផ្នែកនេះមិនទាក់ទាញទេ ប៉ុន្តែវាការពារកំហុសឆ្គងដ៏ល្ងង់ខ្លៅបំផុត។ ខ្ញុំនិយាយដូច្នេះដោយក្តីស្រឡាញ់។.

2) ការអ៊ិនកូដទិន្នន័យប្រភេទ 🔤

ម៉ូដែលភាគច្រើនមិនអាចប្រើខ្សែអក្សរឆៅដូចជា "red""premium_user"

វិធីសាស្រ្តទូទៅ៖

  • ការអ៊ិនកូដ​ក្តៅ​តែមួយ (ប្រភេទ → ជួរឈរ​គោលពីរ) [1]

  • ការអ៊ិនកូដលំដាប់ (ប្រភេទ → លេខសម្គាល់ចំនួនគត់) [1]

រឿងសំខាន់មិនមែនថា មួយណានោះ ទេ - វាគឺថាការធ្វើផែនទីនៅតែស៊ីសង្វាក់គ្នា និងមិន "ផ្លាស់ប្តូររូបរាង" រវាងការហ្វឹកហាត់ និងការសន្និដ្ឋាន។ នោះហើយជារបៀបដែលអ្នកបញ្ចប់ដោយគំរូដែលមើលទៅល្អក្រៅបណ្តាញ ហើយដើរតួជាខ្មោចនៅលើអ៊ីនធឺណិត។ [2]

៣) ការធ្វើមាត្រដ្ឋានលក្ខណៈពិសេស និងការធ្វើឱ្យមានលក្ខណៈធម្មតា 📏

ការធ្វើមាត្រដ្ឋានមានសារៈសំខាន់ នៅពេលដែលលក្ខណៈពិសេសនានាស្ថិតនៅលើជួរខុសគ្នាខ្លាំង។.

បុរាណពីរ៖

  • ស្តង់ដារភាវូបនីយកម្ម ៖ ដកមធ្យមភាគចេញ និងធ្វើមាត្រដ្ឋានទៅជាភាពខុសគ្នានៃឯកតា [1]

  • ការធ្វើមាត្រដ្ឋានអប្បបរមា-អតិបរមា ៖ ធ្វើមាត្រដ្ឋានលក្ខណៈពិសេសនីមួយៗទៅក្នុងជួរដែលបានបញ្ជាក់ [1]

សូម្បីតែពេលអ្នកកំពុងប្រើម៉ូដែលដែល "ភាគច្រើនអាចទ្រាំទ្របាន" ក៏ដោយ ការធ្វើមាត្រដ្ឋានច្រើនតែធ្វើឱ្យបំពង់បង្ហូរប្រេងកាន់តែងាយស្រួលក្នុងការវែកញែក និងពិបាកក្នុងការបំបែកដោយចៃដន្យ។.

៤) វិស្វកម្មលក្ខណៈពិសេស (ហៅម្យ៉ាងទៀតថា ការបន្លំដែលមានប្រយោជន៍) 🧪

នេះជាកន្លែងដែលអ្នកធ្វើឱ្យការងាររបស់គំរូកាន់តែងាយស្រួលដោយបង្កើតសញ្ញាកាន់តែប្រសើរ៖

  • សមាមាត្រ (ចុច / ចំណាប់អារម្មណ៍)

  • បង្អួចរំកិល (N ថ្ងៃចុងក្រោយ)

  • ចំនួន (ព្រឹត្តិការណ៍ក្នុងមួយអ្នកប្រើប្រាស់)

  • ការបំលែងឡូហ្គោសម្រាប់ការចែកចាយកន្ទុយធ្ងន់

មានសិល្បៈមួយនៅទីនេះ។ ពេលខ្លះអ្នកនឹងបង្កើតមុខងារមួយ មានអារម្មណ៍មោទនភាព... ហើយវាមិនដំណើរការអ្វីទាំងអស់។ ឬអាក្រក់ជាងនេះទៅទៀត វាឈឺចាប់។ នោះជារឿងធម្មតា។ កុំភ្ជាប់អារម្មណ៍ទៅនឹងមុខងារ - ពួកគេមិនស្រឡាញ់អ្នកវិញទេ 😅

៥) ការបំបែកទិន្នន័យតាមរបៀបត្រឹមត្រូវ ✂️

នេះស្តាប់ទៅច្បាស់ណាស់រហូតដល់វាមិនមែនជា៖

  • ការបំបែកចៃដន្យសម្រាប់ទិន្នន័យ iid

  • ការបែងចែកផ្អែកលើពេលវេលាសម្រាប់ស៊េរីពេលវេលា

  • ការបំបែកជាក្រុមនៅពេលដែលអង្គភាពធ្វើម្តងទៀត (អ្នកប្រើប្រាស់ ឧបករណ៍ អ្នកជំងឺ)

ហើយសំខាន់ជាងនេះទៅទៀត៖ បំបែកមុនពេលសមសម្រាប់ការដំណើរការជាមុនដែលរៀនពីទិន្នន័យ ។ ប្រសិនបើជំហានដំណើរការជាមុនរបស់អ្នក "រៀន" ប៉ារ៉ាម៉ែត្រ (ដូចជាមធ្យោបាយ វាក្យសព្ទ ផែនទីប្រភេទ) វាត្រូវតែរៀនពួកវាពីការបណ្តុះបណ្តាលតែប៉ុណ្ណោះ។ [2]


ការដំណើរការជាមុនរបស់ AI តាមប្រភេទទិន្នន័យ៖ តារាង អត្ថបទ រូបភាព 🎛️

ការ​កែច្នៃ​ជាមុន​ផ្លាស់ប្តូរ​រូបរាង​អាស្រ័យ​លើ​អ្វី​ដែល​អ្នក​បញ្ចូល​គំរូ។.

ទិន្នន័យតារាង (សៀវភៅបញ្ជី កំណត់ហេតុ មូលដ្ឋានទិន្នន័យ) 📊

ជំហានទូទៅ៖

  • យុទ្ធសាស្ត្រតម្លៃដែលបាត់

  • ការអ៊ិនកូដប្រភេទ [1]

  • ការធ្វើមាត្រដ្ឋានជួរឈរលេខ [1]

  • ការដោះស្រាយ outlier (ច្បាប់ដូមេនល្អជាង "ការកាត់ចៃដន្យ" ភាគច្រើននៃពេលវេលា)

  • លក្ខណៈពិសេសដែលទទួលបាន (ការបូកសរុប ការយឺតយ៉ាវ ស្ថិតិរំកិល)

ដំបូន្មានជាក់ស្តែង៖ កំណត់ក្រុមជួរឈរឱ្យច្បាស់លាស់ (លេខ ទល់នឹង ប្រភេទ ទល់នឹង លេខសម្គាល់)។ អនាគតរបស់អ្នកនឹងអរគុណអ្នក។.

ទិន្នន័យអត្ថបទ (NLP) 📝

ការដំណើរការអត្ថបទជាមុនជារឿយៗរួមមាន៖

  • ការធ្វើសញ្ញាសម្គាល់ទៅជាសញ្ញាសម្គាល់/ពាក្យរង

  • ការបម្លែងទៅជា លេខសម្គាល់បញ្ចូល

  • ការបន្ថែម/ការកាត់ខ្លី

  • របាំងមុខ សម្រាប់បង្កើត សម្រាប់ការផលិតជាបាច់ [3]

ច្បាប់តូចមួយដែលជួយសន្សំសំចៃពេលវេលា៖ សម្រាប់ការដំឡើងដែលមានមូលដ្ឋានលើឧបករណ៍បំលែង សូមអនុវត្តតាមការកំណត់សញ្ញាសម្គាល់ដែលរំពឹងទុករបស់ម៉ូដែល ហើយកុំធ្វើរចនាប័ទ្មសេរី លុះត្រាតែអ្នកមានហេតុផល។ រចនាប័ទ្មសេរីគឺជារបៀបដែលអ្នកបញ្ចប់ដោយ "វាហ្វឹកហាត់ ប៉ុន្តែវាចម្លែក"។

រូបភាព (ចក្ខុវិស័យកុំព្យូទ័រ) 🖼️

ការកែច្នៃជាមុនធម្មតា៖

  • ប្ដូរទំហំ/កាត់​ទៅ​ជា​រាង​ដែល​ស៊ីសង្វាក់​គ្នា

  • ការបំប្លែងកំណត់សម្រាប់ការវាយតម្លៃ

  • ការបំលែងចៃដន្យសម្រាប់ការបង្កើនការបណ្តុះបណ្តាល (ឧទាហរណ៍ ការច្រឹបចៃដន្យ) [4]

ចំណុច​មួយ​ដែល​មនុស្ស​មើល​រំលង៖ “ការ​បំលែង​ចៃដន្យ” មិនមែន​គ្រាន់​តែ​ជា​អារម្មណ៍​មួយ​ទេ - ពួក​វា​ពិត​ជា​យក​គំរូ​ប៉ារ៉ាម៉ែត្រ​រាល់​ពេល​ដែល​ពួកគេ​ត្រូវ​បាន​ហៅ។ ល្អ​សម្រាប់​ការ​បណ្តុះបណ្តាល​ភាព​ចម្រុះ ហើយ​អាក្រក់​សម្រាប់​ការ​វាយតម្លៃ​ប្រសិនបើ​អ្នក​ភ្លេច​បិទ​ភាព​ចៃដន្យ។ [4]


អន្ទាក់ដែលមនុស្សគ្រប់គ្នាធ្លាក់ចូលទៅក្នុង៖ ការលេចធ្លាយទិន្នន័យ 🕳️🐍

ការលេចធ្លាយគឺជាពេលដែលព័ត៌មានពីទិន្នន័យវាយតម្លៃលួចចូលទៅក្នុងការបណ្តុះបណ្តាល - ជារឿយៗតាមរយៈការដំណើរការជាមុន។ វាអាចធ្វើឱ្យគំរូរបស់អ្នកមើលទៅអស្ចារ្យក្នុងអំឡុងពេលផ្ទៀងផ្ទាត់ ហើយបន្ទាប់មកធ្វើឱ្យអ្នកខកចិត្តនៅក្នុងពិភពពិត។.

លំនាំលេចធ្លាយទូទៅ៖

  • ការធ្វើមាត្រដ្ឋានដោយប្រើស្ថិតិសំណុំទិន្នន័យពេញលេញ (ជំនួសឱ្យការបណ្តុះបណ្តាលតែប៉ុណ្ណោះ) [2]

  • ការកសាងផែនទីប្រភេទដោយប្រើរថភ្លើង + សាកល្បងជាមួយគ្នា [2]

  • fit()fit_transform() ណាមួយ ដែល "ឃើញ" សំណុំតេស្ត [2]

ច្បាប់សាមញ្ញ (សាមញ្ញ ឃោរឃៅ មានប្រសិទ្ធភាព)៖

  • អ្វីក៏ដោយដែលមាន ហាត់ប្រាណ គួរតែហាត់ប្រាណបានតែក្នុងពេលហ្វឹកហាត់ប៉ុណ្ណោះ។

  • បន្ទាប់មកអ្នក បំលែង ការផ្ទៀងផ្ទាត់/ការធ្វើតេស្តដោយប្រើឧបករណ៍បំលែងដែលបានបំពាក់នោះ។ [2]

ហើយប្រសិនបើអ្នកចង់បាន "តើវាអាចអាក្រក់ប៉ុណ្ណា?" ការត្រួតពិនិត្យពោះវៀន៖ ឯកសារផ្ទាល់ខ្លួនរបស់ scikit-learn បង្ហាញឧទាហរណ៍នៃការលេចធ្លាយដែលលំដាប់ដំណើរការជាមុនមិនត្រឹមត្រូវផ្តល់នូវភាពត្រឹមត្រូវប្រហែល 0.76 លើគោលដៅចៃដន្យ - បន្ទាប់មកធ្លាក់ចុះមក ~ 0.5 នៅពេលដែលការលេចធ្លាយត្រូវបានជួសជុល។ នោះហើយជារបៀបដែលការលេចធ្លាយខុសអាចមើលទៅ។ [2]


ដំណើរការនៃការកែច្នៃជាមុនចូលទៅក្នុងផលិតកម្មដោយគ្មានភាពវឹកវរ 🏗️

ម៉ូដែលជាច្រើនបរាជ័យក្នុងការផលិតមិនមែនដោយសារតែម៉ូដែលនេះ "អាក្រក់" នោះទេ ប៉ុន្តែដោយសារតែ ការពិតនៃការបញ្ចូល ផ្លាស់ប្តូរ - ឬដោយសារតែបំពង់បង្ហូររបស់អ្នកផ្លាស់ប្តូរ។

ការកែច្នៃជាមុនដែលគិតគូរពីផលិតកម្មជាធម្មតារួមមាន៖

  • វត្ថុបុរាណដែលបានរក្សាទុក (ការផ្គូផ្គងឧបករណ៍អ៊ិនកូដឌ័រ ប៉ារ៉ាម៉ែត្រមាត្រដ្ឋាន ការកំណត់រចនាសម្ព័ន្ធថូខិន) ដូច្នេះការសន្និដ្ឋានប្រើការបំលែងដែលបានរៀនដូចគ្នាបេះបិទ [2]

  • កិច្ចសន្យាបញ្ចូលតឹងរ៉ឹង (ជួរឈរ/ប្រភេទ/ជួរដែលរំពឹងទុក)

  • ការតាមដានសម្រាប់ភាពលំអៀង និងការរសាត់ ពីព្រោះទិន្នន័យផលិតកម្ម នឹង វង្វេង [5]

ប្រសិនបើអ្នកចង់បាននិយមន័យជាក់ស្តែង៖ ការត្រួតពិនិត្យគំរូ Vertex AI របស់ Google បែងចែក ភាពលំអៀងនៃការបម្រើការបណ្តុះបណ្តាល (ការចែកចាយផលិតកម្មខុសពីការបណ្តុះបណ្តាល) និង ការរសាត់នៃការសន្និដ្ឋាន (ការចែកចាយផលិតកម្មផ្លាស់ប្តូរតាមពេលវេលា) និងគាំទ្រការត្រួតពិនិត្យទាំងលក្ខណៈពិសេសប្រភេទ និងលេខ។ [5]

ពីព្រោះ​ការភ្ញាក់ផ្អើល​មានតម្លៃថ្លៃ។ ហើយ​មិនមែនជា​ប្រភេទ​សប្បាយ​នោះទេ។.


តារាងប្រៀបធៀប៖ ឧបករណ៍ដំណើរការជាមុន + ឧបករណ៍ត្រួតពិនិត្យទូទៅ (និងឧបករណ៍ទាំងនោះសម្រាប់អ្នកណា) 🧰

ឧបករណ៍/បណ្ណាល័យ ល្អបំផុតសម្រាប់ តម្លៃ ហេតុអ្វីបានជាវាដំណើរការ (និងភាពស្មោះត្រង់បន្តិចបន្តួច)
ការដំណើរការជាមុនរបស់ scikit-learn បំពង់ ML តារាង ឥតគិតថ្លៃ ឧបករណ៍អ៊ិនកូដឌ័ររឹង + ឧបករណ៍ធ្វើមាត្រដ្ឋាន (OneHotEncoder, StandardScaler ជាដើម) និងឥរិយាបថដែលអាចព្យាករណ៍បាន [1]
ឧបករណ៍​បង្កើត​សញ្ញា​សម្គាល់​មុខ​ឱប ការរៀបចំការបញ្ចូល NLP ឥតគិតថ្លៃ បង្កើតលេខសម្គាល់បញ្ចូល + របាំងយកចិត្តទុកដាក់ជាប់លាប់នៅទូទាំងការរត់/ម៉ូដែល [3]
ការផ្លាស់ប្តូរ Torchvision ការផ្លាស់ប្តូរចក្ខុវិស័យ + ការបង្កើន ឥតគិតថ្លៃ វិធីស្អាតដើម្បីលាយបញ្ចូលគ្នានូវការបំលែងកំណត់ និងចៃដន្យនៅក្នុងបំពង់បង្ហូរតែមួយ [4]
ការត្រួតពិនិត្យម៉ូដែល Vertex AI ការរកឃើញភាពរសាត់/ភាពលំអៀងនៅក្នុងផលិតផល បានបង់ប្រាក់ (ពពក) ម៉ូនីទ័រមានលក្ខណៈពិសេសនៃការលំអៀង/ការរសាត់ និងការជូនដំណឹងនៅពេលដែលកម្រិតកំណត់ត្រូវបានលើស [5]

(មែនហើយ តារាងនេះនៅតែមានមតិយោបល់។ ប៉ុន្តែយ៉ាងហោចណាស់វាជាមតិយោបល់ស្មោះត្រង់ 😅)


បញ្ជីត្រួតពិនិត្យមុនដំណើរការជាក់ស្តែងដែលអ្នកពិតជាអាចប្រើប្រាស់បាន📌

មុនពេលហ្វឹកហាត់

  • កំណត់គ្រោងការណ៍បញ្ចូល (ប្រភេទ ឯកតា ជួរដែលអនុញ្ញាត)

  • ត្រួតពិនិត្យតម្លៃដែលបាត់ និងតម្លៃស្ទួន

  • បំបែកទិន្នន័យតាមវិធីត្រឹមត្រូវ (ចៃដន្យ / ផ្អែកលើពេលវេលា / ដាក់ជាក្រុម)

  • ការដំណើរការជាមុននៃ Fit លើ ការហ្វឹកហាត់តែប៉ុណ្ណោះ ( fit / fit_transform នៅតែដំណើរការ) [2]

  • រក្សាទុកវត្ថុបុរាណដែលដំណើរការជាមុន ដូច្នេះការសន្និដ្ឋានអាចប្រើប្រាស់វាឡើងវិញបាន [2]

អំឡុងពេលហ្វឹកហាត់

  • អនុវត្តការបង្កើនដោយចៃដន្យតែនៅកន្លែងដែលសមស្រប (ជាធម្មតាការបំបែកការបណ្តុះបណ្តាលតែប៉ុណ្ណោះ) [4]

  • រក្សាការវាយតម្លៃជាមុនឱ្យមានលក្ខណៈកំណត់ [4]

  • តាមដានការផ្លាស់ប្តូរមុនដំណើរការដូចជាការផ្លាស់ប្តូរគំរូ (ពីព្រោះវាជា)

មុនពេលដាក់ពង្រាយ

  • ត្រូវប្រាកដថាការសន្និដ្ឋានប្រើផ្លូវដំណើរការមុន និងវត្ថុបុរាណដូចគ្នា [2]

  • រៀបចំការត្រួតពិនិត្យការរសាត់/ភាពលំអៀង (សូម្បីតែការត្រួតពិនិត្យការចែកចាយមុខងារជាមូលដ្ឋានក៏មានប្រសិទ្ធភាពខ្ពស់ដែរ) [5]


ស្វែងយល់ឲ្យស៊ីជម្រៅ៖ កំហុសឆ្គងទូទៅនៃការដំណើរការមុន (និងវិធីជៀសវាងវា) 🧯

កំហុសទី 1: "ខ្ញុំនឹងធ្វើឱ្យអ្វីៗគ្រប់យ៉ាងមានលក្ខណៈធម្មតាឡើងវិញយ៉ាងឆាប់រហ័ស" 😵

ប្រសិនបើអ្នកគណនាប៉ារ៉ាម៉ែត្រធ្វើមាត្រដ្ឋាននៅលើសំណុំទិន្នន័យពេញលេញ អ្នកកំពុងលេចធ្លាយព័ត៌មានវាយតម្លៃ។ សមនឹងរថភ្លើង បំលែងអ្វីដែលនៅសល់។ [2]

កំហុសទី 2: ប្រភេទសត្វកំពុងរសាត់ទៅក្នុងភាពវឹកវរ 🧩

ប្រសិនបើការគូសផែនទីប្រភេទរបស់អ្នកផ្លាស់ប្តូររវាងការហ្វឹកហ្វឺន និងការសន្និដ្ឋាន គំរូរបស់អ្នកអាចអានពិភពលោកខុសដោយស្ងៀមស្ងាត់។ រក្សាការគូសផែនទីឱ្យថេរតាមរយៈវត្ថុបុរាណដែលបានរក្សាទុក។ [2]

កំហុសទី 3: ការបង្កើនដោយចៃដន្យលួចចូលទៅក្នុងការវាយតម្លៃ 🎲

ការបំលែងចៃដន្យគឺអស្ចារ្យណាស់នៅក្នុងការហ្វឹកហាត់ ប៉ុន្តែវាមិនគួរត្រូវបាន "បើកដោយសម្ងាត់" នៅពេលអ្នកកំពុងព្យាយាមវាស់ស្ទង់ការអនុវត្តនោះទេ។ (ចៃដន្យមានន័យថាចៃដន្យ។) [4]


កំណត់ចំណាំចុងក្រោយ🧠✨

ការកែច្នៃជាមុនដោយ AI គឺជាសិល្បៈដែលមានវិន័យក្នុងការប្រែក្លាយការពិតដ៏រញ៉េរញ៉ៃទៅជាធាតុចូលគំរូដែលស៊ីសង្វាក់គ្នា។ វាគ្របដណ្តប់លើការសម្អាត ការអ៊ិនកូដ ការធ្វើមាត្រដ្ឋាន ការធ្វើសញ្ញាសម្ងាត់ ការបំលែងរូបភាព និងសំខាន់បំផុតគឺបំពង់បង្ហូរទិន្នន័យ និងវត្ថុបុរាណដែលអាចធ្វើម្តងទៀត។

  • ធ្វើការកែច្នៃជាមុនដោយចេតនា មិនមែនដោយចៃដន្យទេ។ [2]

  • បំបែកជាមុនសិន ការផ្លាស់ប្តូររូបរាងសមល្មមសម្រាប់ការហ្វឹកហាត់តែប៉ុណ្ណោះ ជៀសវាងការលេចធ្លាយ។ [2]

  • ប្រើការដំណើរការជាមុនដែលសមស្របតាមម៉ូឌុល (សញ្ញាសម្គាល់សម្រាប់អត្ថបទ ការបំលែងសម្រាប់រូបភាព)។ [3][4]

  • តាមដានភាពលំអៀង/ការរសាត់នៃផលិតកម្ម ដើម្បីកុំឱ្យគំរូរបស់អ្នករសាត់បន្តិចម្តងៗទៅជារឿងមិនសមហេតុផល។ [5]

ហើយប្រសិនបើអ្នកធ្លាប់ជាប់គាំង សូមសួរខ្លួនឯងថា
“តើជំហានដំណើរការជាមុននេះនៅតែសមហេតុផលទេ ប្រសិនបើខ្ញុំដំណើរការវានៅថ្ងៃស្អែកលើទិន្នន័យថ្មី?”
ប្រសិនបើចម្លើយគឺ “អឺ… ប្រហែលជា?” នោះជាតម្រុយរបស់អ្នក 😬


សំណួរដែលសួរញឹកញាប់

តើ​ការ​ដំណើរការ​ជាមុន​របស់ AI និយាយ​ឲ្យ​សាមញ្ញ​ទៅ​ជា​អ្វី?

ការដំណើរការជាមុនរបស់ AI គឺជាសំណុំជំហានដែលអាចធ្វើម្តងទៀតបាន ដែលប្រែក្លាយទិន្នន័យឆៅដែលមានសំឡេងរំខាន និងមានភាពប្រែប្រួលខ្ពស់ទៅជាធាតុចូលដែលស៊ីសង្វាក់គ្នា ដែលគំរូអាចរៀនបាន។ វាអាចរួមបញ្ចូលការសម្អាត ការផ្ទៀងផ្ទាត់ ការអ៊ិនកូដប្រភេទ ការធ្វើមាត្រដ្ឋានតម្លៃលេខ ការធ្វើសញ្ញាសម្ងាត់អត្ថបទ និងការអនុវត្តការបំលែងរូបភាព។ គោលដៅគឺដើម្បីធានាថាការបណ្តុះបណ្តាល និងការសន្និដ្ឋានផលិតកម្មមើលឃើញធាតុចូល "ប្រភេទដូចគ្នា" ដូច្នេះគំរូមិនរសាត់ទៅក្នុងឥរិយាបថដែលមិនអាចទាយទុកជាមុនបាននៅពេលក្រោយ។.

ហេតុអ្វីបានជាការកែច្នៃជាមុនរបស់ AI មានសារៈសំខាន់ខ្លាំងម្ល៉េះនៅក្នុងផលិតកម្ម?

ការដំណើរការជាមុនមានសារៈសំខាន់ ពីព្រោះគំរូងាយនឹងរងផលប៉ះពាល់ដោយការតំណាងធាតុចូល។ ប្រសិនបើទិន្នន័យបណ្តុះបណ្តាលត្រូវបានធ្វើមាត្រដ្ឋាន អ៊ិនកូដ ធ្វើជាថូខឹន ឬបំលែងខុសពីទិន្នន័យផលិតកម្ម អ្នកអាចទទួលបានការបរាជ័យនៃការមិនស៊ីគ្នានៃការហ្វឹកហាត់/បម្រើ ដែលមើលទៅល្អនៅក្រៅបណ្តាញ ប៉ុន្តែបរាជ័យយ៉ាងស្ងៀមស្ងាត់នៅលើបណ្តាញ។ បំពង់ដំណើរការជាមុនដ៏រឹងមាំក៏កាត់បន្ថយសំឡេងរំខាន ធ្វើអោយប្រសើរឡើងនូវស្ថេរភាពនៃការរៀនសូត្រ និងបង្កើនល្បឿននៃការធ្វើម្តងទៀត ពីព្រោះអ្នកមិនកំពុងស្រាយស្ប៉ាហ្គេតទីសៀវភៅកត់ត្រាដែលច្របូកច្របល់នោះទេ។.

តើខ្ញុំធ្វើដូចម្តេចដើម្បីជៀសវាងការលេចធ្លាយទិន្នន័យនៅពេលដំណើរការជាមុន?

ច្បាប់សាមញ្ញមួយដំណើរការ៖ អ្វីក៏ដោយដែលមាន សម ត្រូវតែសមលើទិន្នន័យបណ្តុះបណ្តាលតែប៉ុណ្ណោះ។ នោះរួមបញ្ចូលទាំងឧបករណ៍ធ្វើមាត្រដ្ឋាន ឧបករណ៍អ៊ិនកូដឌ័រ និងឧបករណ៍ចាប់សញ្ញាដែលរៀនប៉ារ៉ាម៉ែត្រដូចជាមធ្យម ផែនទីប្រភេទ ឬវាក្យសព្ទ។ អ្នកបំបែកជាមុនសិន សមលើការបែងចែកការបណ្តុះបណ្តាល បន្ទាប់មកបំលែងការផ្ទៀងផ្ទាត់/សាកល្បងដោយប្រើឧបករណ៍បំលែងដែលបានបំពាក់។ ការលេចធ្លាយអាចធ្វើឱ្យការផ្ទៀងផ្ទាត់មើលទៅល្អ "ដោយអព្ភូតហេតុ" ហើយបន្ទាប់មកដួលរលំក្នុងការប្រើប្រាស់ផលិតកម្ម។

តើ​ជំហាន​មុន​ដំណើរការ​ទូទៅ​បំផុត​សម្រាប់​ទិន្នន័យ​តារាង​មាន​អ្វីខ្លះ?

សម្រាប់ទិន្នន័យតារាង បំពង់បង្ហូរទិន្នន័យធម្មតារួមមានការសម្អាត និងការផ្ទៀងផ្ទាត់ (ប្រភេទ ជួរ តម្លៃដែលបាត់) ការអ៊ិនកូដប្រភេទ (មួយក្តៅ ឬលំដាប់) និងការធ្វើមាត្រដ្ឋានលេខ (ស្តង់ដារភាវូបនីយកម្ម ឬអប្បបរមា-អតិបរមា)។ បំពង់បង្ហូរទិន្នន័យជាច្រើនបន្ថែមវិស្វកម្មលក្ខណៈពិសេសដែលជំរុញដោយដែនដូចជាសមាមាត្រ បង្អួចរំកិល ឬការរាប់។ ទម្លាប់ជាក់ស្តែងមួយគឺត្រូវកំណត់ក្រុមជួរឈរឱ្យច្បាស់លាស់ (លេខ ទល់នឹង ប្រភេទ ទល់នឹង ឧបករណ៍កំណត់អត្តសញ្ញាណ) ដូច្នេះការបំលែងរបស់អ្នកនៅតែស៊ីសង្វាក់គ្នា។.

តើ​ការ​ដំណើរការ​ជាមុន​ដំណើរការ​យ៉ាង​ដូចម្តេច​សម្រាប់​គំរូ​អត្ថបទ?

ការដំណើរការអត្ថបទជាមុនជាធម្មតាមានន័យថា ការធ្វើសញ្ញាសម្ងាត់ទៅជាសញ្ញាសម្ងាត់/ពាក្យរង បំលែងវាទៅជាលេខសម្គាល់ធាតុចូល និងដោះស្រាយការបន្ថែម/កាត់សម្រាប់ការបាច់។ លំហូរការងាររបស់ឧបករណ៍បំលែងជាច្រើនក៏បង្កើតរបាំងយកចិត្តទុកដាក់រួមជាមួយលេខសម្គាល់ផងដែរ។ វិធីសាស្រ្តទូទៅមួយគឺត្រូវប្រើការកំណត់រចនាសម្ព័ន្ធសញ្ញាសម្ងាត់ដែលរំពឹងទុករបស់គំរូជាជាងការកែលម្អ ពីព្រោះភាពខុសគ្នាតិចតួចនៅក្នុងការកំណត់សញ្ញាសម្ងាត់អាចនាំឱ្យមានលទ្ធផល "វាហ្វឹកហាត់ ប៉ុន្តែវាមានឥរិយាបទមិនអាចទាយទុកជាមុនបាន"។.

តើ​មាន​អ្វី​ខុស​គ្នា​អំពី​ការ​ដំណើរការ​រូបភាព​ជាមុន​សម្រាប់​ការ​រៀន​របស់​ម៉ាស៊ីន?

ការកែច្នៃរូបភាពជាមុនជាធម្មតាធានានូវរូបរាង និងការគ្រប់គ្រងភីកសែលដែលមានភាពស៊ីសង្វាក់គ្នា៖ ការផ្លាស់ប្តូរទំហំ/ការច្រឹប ការធ្វើឱ្យមានលក្ខណៈធម្មតា និងការបែងចែកច្បាស់លាស់រវាងការបំលែងកំណត់ និងការបំលែងចៃដន្យ។ សម្រាប់ការវាយតម្លៃ ការបំលែងគួរតែកំណត់ ដើម្បីឱ្យម៉ែត្រអាចប្រៀបធៀបបាន។ សម្រាប់ការហ្វឹកហ្វឺន ការបង្កើនចៃដន្យ (ដូចជាការច្រឹបចៃដន្យ) អាចធ្វើអោយប្រសើរឡើងនូវភាពរឹងមាំ ប៉ុន្តែភាពចៃដន្យត្រូវតែត្រូវបានកំណត់វិសាលភាពដោយចេតនាចំពោះការបំបែកការហ្វឹកហ្វឺន មិនមែនទុកចោលដោយចៃដន្យក្នុងអំឡុងពេលវាយតម្លៃនោះទេ។.

តើ​អ្វី​ទៅ​ដែល​ធ្វើ​ឱ្យ​បំពង់​ដំណើរការ​មុន​ដំណើរការ "ល្អ" ជំនួស​ឱ្យ​ការ​ផុយស្រួយ?

បំពង់​ដំណើរការ​មុន​នៃ​ AI ដ៏ល្អមួយ​គឺអាច​បង្កើត​ឡើងវិញបាន មានសុវត្ថិភាព​ក្នុងការលេចធ្លាយ និងអាចសង្កេតឃើញ។ អាចបង្កើតឡើងវិញបានមានន័យថា ការបញ្ចូលដូចគ្នាបង្កើតទិន្នផលដូចគ្នា លុះត្រាតែភាពចៃដន្យគឺជាការបង្កើនដោយចេតនា។ សុវត្ថិភាព​ក្នុងការលេចធ្លាយមានន័យថា ជំហានសមស្របមិនដែលប៉ះនឹងការផ្ទៀងផ្ទាត់/ការធ្វើតេស្តឡើយ។ អាចសង្កេតឃើញមានន័យថា អ្នកអាចត្រួតពិនិត្យស្ថិតិដូចជាការបាត់ ចំនួនប្រភេទ និងការចែកចាយលក្ខណៈពិសេស ដូច្នេះការបំបាត់កំហុសគឺផ្អែកលើភស្តុតាង មិនមែនអារម្មណ៍ពិតនោះទេ។ បំពង់បង្ហូរទិន្នន័យយកឈ្នះលើលំដាប់សៀវភៅកត់ត្រា ad-hoc រាល់ពេល។.

តើខ្ញុំធ្វើដូចម្តេចដើម្បីរក្សាការហ្វឹកហ្វឺន និងការសន្និដ្ឋានជាមុនឲ្យមានភាពស៊ីសង្វាក់គ្នា?

ចំណុចសំខាន់គឺត្រូវប្រើឡើងវិញនូវវត្ថុបុរាណដែលបានរៀនដូចគ្នាបេះបិទនៅពេលសន្និដ្ឋាន៖ ប៉ារ៉ាម៉ែត្រ scaler ការផ្គូផ្គង encoder និងការកំណត់រចនាសម្ព័ន្ធ tokenizer។ អ្នកក៏ចង់បានកិច្ចសន្យាបញ្ចូល (ជួរឈរ ប្រភេទ និងជួរដែលរំពឹងទុក) ដូច្នេះទិន្នន័យផលិតកម្មមិនអាចរសាត់ទៅក្នុងរាងមិនត្រឹមត្រូវដោយស្ងៀមស្ងាត់បានទេ។ ភាពស៊ីសង្វាក់គ្នាមិនមែនគ្រាន់តែ "ធ្វើជំហានដូចគ្នា" នោះទេ - វាគឺជា "ធ្វើជំហានដូចគ្នាជាមួយនឹងប៉ារ៉ាម៉ែត្រ និងការផ្គូផ្គងដែលបានដំឡើងដូចគ្នា"។

តើខ្ញុំអាចតាមដានបញ្ហាដំណើរការមុនដូចជាការរសាត់ និងភាពលំអៀងតាមពេលវេលាដោយរបៀបណា?

ទោះបីជាមានបំពង់បង្ហូរទិន្នន័យរឹងមាំក៏ដោយ ទិន្នន័យផលិតកម្មនៅតែផ្លាស់ប្តូរ។ វិធីសាស្រ្តទូទៅមួយគឺតាមដានការផ្លាស់ប្តូរការចែកចាយលក្ខណៈពិសេស និងជូនដំណឹងអំពីភាពលំអៀងនៃការបម្រើការបណ្តុះបណ្តាល (ផលិតកម្មងាកចេញពីការបណ្តុះបណ្តាល) និងការរសាត់នៃការសន្និដ្ឋាន (ការផ្លាស់ប្តូរផលិតកម្មតាមពេលវេលា)។ ការត្រួតពិនិត្យអាចមានទម្ងន់ស្រាល (ការត្រួតពិនិត្យការចែកចាយជាមូលដ្ឋាន) ឬគ្រប់គ្រង (ដូចជាការត្រួតពិនិត្យគំរូ Vertex AI)។ គោលដៅគឺដើម្បីចាប់យកការផ្លាស់ប្តូរធាតុចូលឱ្យបានឆាប់ - មុនពេលពួកវាធ្វើឱ្យខូចដំណើរការគំរូបន្តិចម្តងៗ។.

ឯកសារយោង

[1] API scikit-learn៖
sklearn.preprocessing (កម្មវិធីអ៊ិនកូដឌ័រ ស្កែល័រ ការធ្វើឱ្យមានលក្ខណៈធម្មតា) [2] scikit-learn៖ កំហុសទូទៅ - ការលេចធ្លាយទិន្នន័យ និងវិធីជៀសវាងវា
[3] ឯកសារ Hugging Face Transformers៖ Tokenizers (លេខសម្គាល់បញ្ចូល របាំងយកចិត្តទុកដាក់)
[4] ឯកសារ PyTorch Torchvision៖ ការបំលែង (ប្តូរទំហំ/ធ្វើឱ្យមានលក្ខណៈធម្មតា + ការបំលែងចៃដន្យ)
[5] ឯកសារ Google Cloud Vertex AI៖ ទិដ្ឋភាពទូទៅនៃការត្រួតពិនិត្យគំរូ (ភាពលំអៀង និងរសាត់នៃលក្ខណៈពិសេស)

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ