ពេលខ្លះ AI មានអារម្មណ៍ដូចជាល្បិចវេទមន្តមួយ។ អ្នកវាយបញ្ចូលសំណួរចៃដន្យ ហើយចម្លើយដ៏រលូន និងល្អឥតខ្ចោះនឹងលេចឡើងក្នុងរយៈពេលប៉ុន្មានវិនាទីប៉ុណ្ណោះ។ ប៉ុន្តែនេះជាចំណុចរបត់មួយ៖ នៅពីក្រោយម៉ាស៊ីន "ឆ្លាតវៃ" នីមួយៗ មានមនុស្សពិតប្រាកដកំពុងជំរុញ កែតម្រូវ និងបង្កើតវាឡើងតាមផ្លូវ។ មនុស្សទាំងនោះត្រូវបានគេហៅថាជា អ្នកបណ្តុះបណ្តាល AI ហើយការងារដែលពួកគេធ្វើគឺចម្លែកជាង កំប្លែងជាង និងមានលក្ខណៈជាមនុស្សជាងអ្វីដែលមនុស្សភាគច្រើនសន្មត់។
ចូរយើងស្វែងយល់ពីមូលហេតុដែលគ្រូបង្វឹកទាំងនេះមានសារៈសំខាន់ ស្ថានភាពប្រចាំថ្ងៃរបស់ពួកគេមើលទៅដូចម្ដេច និងមូលហេតុដែលតួនាទីនេះកំពុងលេចធ្លោលឿនជាងការរំពឹងទុករបស់នរណាម្នាក់។.
អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖
🔗 តើការធ្វើអាជ្ញាកណ្តាល AI ជាអ្វី៖ ការពិតនៅពីក្រោយពាក្យចចាមអារ៉ាម
ពន្យល់ពីការធ្វើអាជ្ញាកណ្តាល AI ហានិភ័យ អត្ថប្រយោជន៍ និងការយល់ច្រឡំទូទៅរបស់វា។.
🔗 តម្រូវការផ្ទុកទិន្នន័យសម្រាប់ AI៖ អ្វីដែលអ្នកពិតជាត្រូវដឹង
គ្របដណ្តប់លើតម្រូវការផ្ទុកទិន្នន័យ សមត្ថភាពធ្វើមាត្រដ្ឋាន និងប្រសិទ្ធភាពសម្រាប់ប្រព័ន្ធ AI។.
🔗 តើនរណាជាបិតានៃ AI?
ស្វែងយល់ពីអ្នកត្រួសត្រាយផ្លូវនៃ AI និងប្រភពដើមនៃបញ្ញាសិប្បនិម្មិត។.
អ្វីដែលធ្វើឱ្យគ្រូបង្វឹក AI រឹងមាំម្នាក់? 🏆
វាមិនមែនជាការងារដែលត្រូវធ្វើភ្លាមៗនោះទេ។ គ្រូបង្វឹកល្អបំផុតពឹងផ្អែកលើទេពកោសល្យចម្រុះដ៏ចម្លែកមួយ៖
-
ការអត់ធ្មត់ (ច្រើនណាស់) - តារាម៉ូដែលមិនរៀនក្នុងពេលតែមួយទេ។ គ្រូបង្វឹកបន្តធ្វើការកែតម្រូវដដែលៗរហូតដល់វាជាប់។
-
ការសម្គាល់ភាពខុសគ្នាបន្តិចបន្តួច - ការចាប់អារម្មណ៍លើការចំអក បរិបទវប្បធម៌ ឬភាពលំអៀង គឺជាអ្វីដែលធ្វើឱ្យមតិកែលម្អរបស់មនុស្សមានគុណសម្បត្តិ [1]។
-
ការទំនាក់ទំនងដោយត្រង់ៗ - ពាក់កណ្តាលនៃការងារគឺការសរសេរការណែនាំច្បាស់លាស់ដែល AI មិនអាចអានខុសបាន។
-
ការចង់ដឹងចង់ឃើញ + សីលធម៌ - គ្រូបង្វឹកដ៏ល្អម្នាក់សួរថាតើចម្លើយមួយ "ត្រឹមត្រូវតាមការពិត" ដែរឬទេ ប៉ុន្តែមិនសូវមានសំឡេងក្នុងសង្គម - ជាប្រធានបទចម្បងនៅក្នុងការត្រួតពិនិត្យ AI [2]។
និយាយឲ្យសាមញ្ញទៅ គ្រូបង្វឹកគឺជាគ្រូបង្រៀនមួយផ្នែក ជាអ្នកកែសម្រួលមួយផ្នែក និងជាអ្នកសីលធម៌មួយផ្នែក។.
សង្ខេបអំពីតួនាទីគ្រូបង្វឹក AI (ជាមួយនឹងភាពចម្លែកមួយចំនួន 😉)
| ប្រភេទតួនាទី | អ្នកណាសមបំផុត | ប្រាក់ខែធម្មតា | ហេតុអ្វីបានជាវាដំណើរការ (ឬមិនដំណើរការ) |
|---|---|---|---|
| កម្មវិធីដាក់ស្លាកទិន្នន័យ | មនុស្សដែលចូលចិត្តព័ត៌មានលម្អិតល្អិតល្អន់ | ទាប–មធ្យម $$ | សំខាន់បំផុត; ប្រសិនបើស្លាកមិនស្អាត ម៉ូដែលទាំងមូលនឹងរងផលប៉ះពាល់ [3] 📊 |
| អ្នកឯកទេស RLHF | អ្នកនិពន្ធ អ្នកកែសម្រួល អ្នកវិភាគ | មធ្យម–ខ្ពស់ $$ | ចាត់ថ្នាក់ និងសរសេរការឆ្លើយតបឡើងវិញ ដើម្បីឲ្យស្របនឹងសម្លេង និងភាពច្បាស់លាស់ជាមួយនឹងការរំពឹងទុករបស់មនុស្ស [1] |
| គ្រូបង្វឹកដែន | មេធាវី វេជ្ជបណ្ឌិត អ្នកជំនាញ | នៅទូទាំងផែនទី💼 | ដោះស្រាយពាក្យបច្ចេកទេសពិសេស និងករណីគែមសម្រាប់ប្រព័ន្ធជាក់លាក់នៃឧស្សាហកម្ម |
| អ្នកវាយតម្លៃសុវត្ថិភាព | មនុស្សដែលមានសីលធម៌ខ្ពស់ | មធ្យម $$ | អនុវត្តគោលការណ៍ណែនាំ ដូច្នេះ AI ជៀសវាងខ្លឹមសារដែលបង្កគ្រោះថ្នាក់ [2][5] |
| គ្រូបង្វឹកច្នៃប្រឌិត | សិល្បករ អ្នកនិទានរឿង | មិនអាចទាយទុកជាមុនបាន💡 | ជួយ AI ឲ្យឆ្លុះបញ្ចាំងពីការស្រមើលស្រមៃ ខណៈពេលដែលស្ថិតនៅក្នុងដែនកំណត់សុវត្ថិភាព [5] |
(មែនហើយ ការធ្វើទ្រង់ទ្រាយមានភាពរញ៉េរញ៉ៃបន្តិច - ដូចជាការងារខ្លួនឯងដែរ។)
មួយថ្ងៃក្នុងជីវិតរបស់គ្រូបង្វឹក AI
ដូច្នេះតើការងារពិតប្រាកដមើលទៅដូចម្ដេច? សូមគិតអំពីការសរសេរកូដដែលមិនសូវមានភាពទាក់ទាញ និងច្រើនជាងនេះ៖
-
ចំណាត់ថ្នាក់ចម្លើយដែលសរសេរដោយ AI ពីអាក្រក់បំផុតទៅល្អបំផុត (ជំហាន RLHF បុរាណ) [1]។.
-
ការជួសជុលភាពច្របូកច្របល់ (ដូចជាពេលដែលតារាម៉ូដែលភ្លេចថាភពសុក្រមិនមែនជាភពអង្គារ)។.
-
ការសរសេរការឆ្លើយតបរបស់ chatbot ឡើងវិញ ដើម្បីឱ្យវាស្តាប់ទៅធម្មជាតិជាង។.
-
ការដាក់ស្លាកអក្សរ រូបភាព ឬសំឡេងជាច្រើនប្រភេទ - ដែលភាពត្រឹមត្រូវពិតជាសំខាន់ [3]។.
-
ការជជែកវែកញែកថាតើ "ត្រឹមត្រូវតាមបច្ចេកទេស" គឺល្អគ្រប់គ្រាន់ឬអត់ ឬថាតើគោលការណ៍ណែនាំសុវត្ថិភាពគួរតែជំនួស [2]។.
វាជាផ្នែកមួយដែលពិបាកបន្តិច និងផ្នែកមួយទៀតជាល្បែងផ្គុំរូប។ និយាយឲ្យត្រង់ទៅ ស្រមៃមើលការបង្រៀនសេកមិនត្រឹមតែឲ្យនិយាយទេ ប៉ុន្តែឲ្យឈប់ប្រើពាក្យខុសបន្តិចបន្តួច - នោះជាអារម្មណ៍។ 🦜
ហេតុអ្វីបានជាគ្រូបង្វឹកមានសារៈសំខាន់ជាងអ្វីដែលអ្នកគិតទៅទៀត
បើគ្មានមនុស្សបើកបរទេ បញ្ញាសិប្បនិម្មិត (AI) នឹង៖
-
សំឡេងរឹង និងរ៉ូប៊ីណេ។.
-
ការរីករាលដាលនៃភាពលំអៀងដោយមិនបានត្រួតពិនិត្យ (គំនិតគួរឱ្យខ្លាច)។.
-
ខ្វះភាពកំប្លុកកំប្លែង ឬការយល់ចិត្តទាំងស្រុង។.
-
មិនសូវមានសុវត្ថិភាពក្នុងបរិបទដែលងាយរងគ្រោះ។.
គ្រូបង្វឹកគឺជាអ្នកដែលលួចចូលទៅក្នុង "របស់របររបស់មនុស្សរញ៉េរញ៉ៃ" - ពាក្យស្លោក ភាពកក់ក្តៅ ពាក្យប្រៀបធៀបដែលរញ៉េរញ៉ៃម្តងម្កាល - ខណៈពេលដែលក៏អនុវត្តរបាំងការពារដើម្បីរក្សារបស់របរឱ្យមានសុវត្ថិភាព [2][5]។.
ជំនាញដែលពិតជាមានតម្លៃ
ភ្លេចរឿងមិនពិតដែលថាអ្នកត្រូវការសញ្ញាបត្របណ្ឌិតទៅ។ អ្វីដែលជួយបានច្រើនបំផុតគឺ៖
-
ការសរសេរ + ការកែសម្រួល - អត្ថបទដែលបានប៉ូលាល្អ ប៉ុន្តែស្តាប់ទៅដូចធម្មជាតិ [1]។
-
ការគិតវិភាគ - ការរកឃើញកំហុសគំរូម្តងហើយម្តងទៀត និងការកែតម្រូវ។
-
ការយល់ដឹងអំពីវប្បធម៌ - ការដឹងពីពេលដែលការសរសេរឃ្លាអាចនឹងខុស [2]។
-
ការអត់ធ្មត់ - ពីព្រោះ AI មិនចាប់បានភ្លាមៗទេ។
ពិន្ទុបន្ថែមសម្រាប់ជំនាញនិយាយច្រើនភាសា ឬជំនាញឯកទេស។.
កន្លែងដែលគ្រូបង្វឹកកំពុងបង្ហាញខ្លួន🌍
ការងារនេះមិនមែនគ្រាន់តែជា chatbots ទេ - វាលួចចូលទៅក្នុងគ្រប់វិស័យ៖
-
ការថែទាំសុខភាព - ការសរសេរច្បាប់ចំណារពន្យល់សម្រាប់ករណីព្រំដែន (បានឆ្លុះបញ្ចាំងនៅក្នុងការណែនាំ AI សុខភាព) [2]។
-
ហិរញ្ញវត្ថុ - បណ្តុះបណ្តាលប្រព័ន្ធរកឃើញការក្លែងបន្លំដោយមិនធ្វើឱ្យមនុស្សលង់ទឹកក្នុងការជូនដំណឹងមិនពិត [2]។
-
លក់រាយ - ជំនួយការបង្រៀនឱ្យយល់អំពីពាក្យស្លោករបស់អ្នកទិញទំនិញ ខណៈពេលដែលប្រកាន់ខ្ជាប់នូវសម្លេងម៉ាក [5]។
-
ការអប់រំ - ការបង្កើតប្រព័ន្ធបង្រៀនតាមប្រព័ន្ធអេឡិចត្រូនិកឲ្យមានលក្ខណៈលើកទឹកចិត្តជំនួសឲ្យការមើលងាយ [5]។
ជាទូទៅ៖ ប្រសិនបើ AI មានកៅអីនៅតុ នោះនឹងមានគ្រូបង្វឹកលាក់ខ្លួននៅផ្ទៃខាងក្រោយ។.
ប៊ីតសីលធម៌ (មិនអាចរំលងរឿងនេះបានទេ)
នេះជាកន្លែងដែលវាក្លាយជារឿងសំខាន់។ ប្រសិនបើគ្មានការត្រួតពិនិត្យទេ បញ្ញាសិប្បនិម្មិត (AI) នឹងនិយាយឡើងវិញនូវគំរូដើម ព័ត៌មានមិនពិត ឬអ្វីដែលអាក្រក់ជាងនេះទៅទៀត។ គ្រូបង្វឹកបញ្ឈប់រឿងនោះដោយប្រើវិធីសាស្ត្រដូចជា RLHF ឬច្បាប់រដ្ឋធម្មនុញ្ញដែលដឹកនាំគំរូឆ្ពោះទៅរកចម្លើយដែលមានប្រយោជន៍ និងមិនបង្កគ្រោះថ្នាក់ [1][5]។.
ឧទាហរណ៍៖ ប្រសិនបើ bot ជំរុញអនុសាសន៍ការងារដែលលំអៀង គ្រូបង្វឹកនឹងសម្គាល់វា សរសេរសៀវភៅច្បាប់ឡើងវិញ ហើយធ្វើឱ្យប្រាកដថាវាមិនកើតឡើងម្តងទៀត។ នោះគឺជាភាពមិនប្រុងប្រយ័ត្នក្នុងសកម្មភាព [2]។.
ផ្នែកដែលមិនសូវសប្បាយ
វាមិនភ្លឺចែងចាំងទាំងអស់នោះទេ។ ស្បែកជើងប៉ាតាអាចដោះស្រាយជាមួយ៖
-
ភាពឯកា - ការដាក់ស្លាកគ្មានទីបញ្ចប់ក្លាយជារឿងចាស់។
-
អស់កម្លាំងផ្លូវចិត្ត - ការពិនិត្យឡើងវិញនូវខ្លឹមសារដែលបង្កគ្រោះថ្នាក់ ឬរំខានអាចបង្កផលប៉ះពាល់។ ប្រព័ន្ធគាំទ្រគឺមានសារៈសំខាន់ណាស់ [4]។
-
កង្វះការទទួលស្គាល់ - អ្នកប្រើប្រាស់កម្រដឹងថាមានគ្រូបង្វឹកណាស់។
-
ការផ្លាស់ប្តូរឥតឈប់ឈរ - ឧបករណ៍វិវត្តឥតឈប់ឈរ មានន័យថាគ្រូបង្វឹកត្រូវតែតាមទាន់។
យ៉ាងណាក៏ដោយ សម្រាប់មនុស្សជាច្រើន ភាពរំភើបនៃការបង្កើត «ខួរក្បាល» នៃបច្ចេកវិទ្យានៅតែធ្វើឱ្យពួកគេជាប់ចិត្ត។.
MVP ដែលលាក់កំបាំងនៃ AI
ដូច្នេះ តើអ្នកបណ្តុះបណ្តាល AI ជានរណា? ពួកគេគឺជាស្ពានរវាងក្បួនដោះស្រាយឆៅ និងប្រព័ន្ធដែល ដំណើរការ សម្រាប់មនុស្ស។ បើគ្មានពួកគេទេ AI នឹងដូចជាបណ្ណាល័យដែលគ្មានបណ្ណារក្ស - មានព័ត៌មានច្រើនសន្ធឹកសន្ធាប់ ប៉ុន្តែស្ទើរតែមិនអាចប្រើប្រាស់បាន។
លើកក្រោយ នៅពេលណាដែល chatbot ធ្វើឱ្យអ្នកសើច ឬមានអារម្មណ៍ "ស្របគ្នា" យ៉ាងគួរឱ្យភ្ញាក់ផ្អើល សូមថ្លែងអំណរគុណដល់គ្រូបង្វឹក។ ពួកគេគឺជាតួអង្គស្ងប់ស្ងាត់ដែលធ្វើឱ្យម៉ាស៊ីនមិនត្រឹមតែគណនាប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងភ្ជាប់ទំនាក់ទំនងផងដែរ [1][2][5]។.
ឯកសារយោង
[1] Ouyang, L. et al. (2022). ការបណ្តុះបណ្តាលគំរូភាសាដើម្បីអនុវត្តតាមការណែនាំជាមួយនឹងមតិប្រតិកម្មរបស់មនុស្ស (InstructGPT). NeurIPS. តំណភ្ជាប់
[2] NIST (2023). ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យបញ្ញាសិប្បនិម្មិត (AI RMF 1.0). តំណភ្ជាប់.
[3] Northcutt, C. et al. (2021)។ កំហុសស្លាកដែលរីករាលដាលនៅក្នុងសំណុំតេស្តធ្វើឱ្យស្តង់ដារសិក្សារបស់ម៉ាស៊ីនមិនស្ថិតស្ថេរ។ សំណុំទិន្នន័យ និងស្តង់ដារសិក្សារបស់ NeurIPS។ តំណភ្ជាប់
[4] WHO/ILO (2022)។ គោលការណ៍ណែនាំស្តីពីសុខភាពផ្លូវចិត្តនៅកន្លែងធ្វើការ។ តំណភ្ជាប់
[5] Bai, Y. et al. (2022). បញ្ញាសិប្បនិម្មិតតាមរដ្ឋធម្មនុញ្ញ៖ ភាពគ្មានគ្រោះថ្នាក់ពីមតិប្រតិកម្មបញ្ញាសិប្បនិម្មិត។ arXiv. តំណភ្ជាប់