តើគ្រូបង្វឹក AI ជាអ្វី?

ពេលខ្លះ AI មានអារម្មណ៍ដូចជាល្បិចវេទមន្តមួយ។ អ្នកវាយបញ្ចូលសំណួរចៃដន្យ ហើយចម្លើយដ៏រលូន និងល្អឥតខ្ចោះនឹងលេចឡើងក្នុងរយៈពេលប៉ុន្មានវិនាទីប៉ុណ្ណោះ។ ប៉ុន្តែនេះជាចំណុចរបត់មួយ៖ នៅពីក្រោយម៉ាស៊ីន "ឆ្លាតវៃ" នីមួយៗ មានមនុស្សពិតប្រាកដកំពុងជំរុញ កែតម្រូវ និងបង្កើតវាឡើងតាមផ្លូវ។ មនុស្សទាំងនោះត្រូវបានគេហៅថាជា អ្នកបណ្តុះបណ្តាល AIហើយការងារដែលពួកគេធ្វើគឺចម្លែកជាង កំប្លែងជាង និងមានលក្ខណៈជាមនុស្សជាងអ្វីដែលមនុស្សភាគច្រើនសន្មត់។

ចូរយើងស្វែងយល់ពីមូលហេតុដែលគ្រូបង្វឹកទាំងនេះមានសារៈសំខាន់ ស្ថានភាពប្រចាំថ្ងៃរបស់ពួកគេមើលទៅដូចម្ដេច និងមូលហេតុដែលតួនាទីនេះកំពុងលេចធ្លោលឿនជាងការរំពឹងទុករបស់នរណាម្នាក់។.

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 តើការធ្វើអាជ្ញាកណ្តាល AI ជាអ្វី៖ ការពិតនៅពីក្រោយពាក្យចចាមអារ៉ាម
ពន្យល់ពីការធ្វើអាជ្ញាកណ្តាល AI ហានិភ័យ អត្ថប្រយោជន៍ និងការយល់ច្រឡំទូទៅរបស់វា។.

🔗 តម្រូវការផ្ទុកទិន្នន័យសម្រាប់ AI៖ អ្វីដែលអ្នកពិតជាត្រូវដឹង
គ្របដណ្តប់លើតម្រូវការផ្ទុកទិន្នន័យ សមត្ថភាពធ្វើមាត្រដ្ឋាន និងប្រសិទ្ធភាពសម្រាប់ប្រព័ន្ធ AI។.

🔗 តើនរណាជាបិតានៃ AI?
ស្វែងយល់ពីអ្នកត្រួសត្រាយផ្លូវនៃ AI និងប្រភពដើមនៃបញ្ញាសិប្បនិម្មិត។.

អ្វីដែលធ្វើឱ្យគ្រូបង្វឹក AI រឹងមាំម្នាក់? 🏆

វាមិនមែនជាការងារដែលត្រូវធ្វើភ្លាមៗនោះទេ។ គ្រូបង្វឹកល្អបំផុតពឹងផ្អែកលើទេពកោសល្យចម្រុះដ៏ចម្លែកមួយ៖

ការអត់ធ្មត់ (ច្រើនណាស់) - តារាម៉ូដែលមិនរៀនក្នុងពេលតែមួយទេ។ គ្រូបង្វឹកបន្តធ្វើការកែតម្រូវដដែលៗរហូតដល់វាជាប់។
ការសម្គាល់ភាពខុសគ្នាបន្តិចបន្តួច - ការចាប់អារម្មណ៍លើការចំអក បរិបទវប្បធម៌ ឬភាពលំអៀង គឺជាអ្វីដែលធ្វើឱ្យមតិកែលម្អរបស់មនុស្សមានគុណសម្បត្តិ [1]។
ការទំនាក់ទំនងដោយត្រង់ៗ - ពាក់កណ្តាលនៃការងារគឺការសរសេរការណែនាំច្បាស់លាស់ដែល AI មិនអាចអានខុសបាន។
ការចង់ដឹងចង់ឃើញ + សីលធម៌ - គ្រូបង្វឹកដ៏ល្អម្នាក់សួរថាតើចម្លើយមួយ "ត្រឹមត្រូវតាមការពិត" ដែរឬទេ ប៉ុន្តែមិនសូវមានសំឡេងក្នុងសង្គម - ជាប្រធានបទចម្បងនៅក្នុងការត្រួតពិនិត្យ AI [2]។

និយាយឲ្យសាមញ្ញទៅ គ្រូបង្វឹកគឺជាគ្រូបង្រៀនមួយផ្នែក ជាអ្នកកែសម្រួលមួយផ្នែក និងជាអ្នកសីលធម៌មួយផ្នែក។.

សង្ខេបអំពីតួនាទីគ្រូបង្វឹក AI (ជាមួយនឹងភាពចម្លែកមួយចំនួន 😉)

ប្រភេទតួនាទី	អ្នកណាសមបំផុត	ប្រាក់ខែធម្មតា	ហេតុអ្វីបានជាវាដំណើរការ (ឬមិនដំណើរការ)
កម្មវិធីដាក់ស្លាកទិន្នន័យ	មនុស្សដែលចូលចិត្តព័ត៌មានលម្អិតល្អិតល្អន់	ទាប–មធ្យម $$	សំខាន់បំផុត; ប្រសិនបើស្លាកមិនស្អាត ម៉ូដែលទាំងមូលនឹងរងផលប៉ះពាល់ [3] 📊
អ្នកឯកទេស RLHF	អ្នកនិពន្ធ អ្នកកែសម្រួល អ្នកវិភាគ	មធ្យម–ខ្ពស់ $$	ចាត់ថ្នាក់ និងសរសេរការឆ្លើយតបឡើងវិញ ដើម្បីឲ្យស្របនឹងសម្លេង និងភាពច្បាស់លាស់ជាមួយនឹងការរំពឹងទុករបស់មនុស្ស [1]
គ្រូបង្វឹកដែន	មេធាវី វេជ្ជបណ្ឌិត អ្នកជំនាញ	នៅទូទាំងផែនទី💼	ដោះស្រាយពាក្យបច្ចេកទេសពិសេស និងករណីគែមសម្រាប់ប្រព័ន្ធជាក់លាក់នៃឧស្សាហកម្ម
អ្នកវាយតម្លៃសុវត្ថិភាព	មនុស្សដែលមានសីលធម៌ខ្ពស់	មធ្យម $$	អនុវត្តគោលការណ៍ណែនាំ ដូច្នេះ AI ជៀសវាងខ្លឹមសារដែលបង្កគ្រោះថ្នាក់ [2][5]
គ្រូបង្វឹកច្នៃប្រឌិត	សិល្បករ អ្នកនិទានរឿង	មិនអាចទាយទុកជាមុនបាន💡	ជួយ AI ឲ្យឆ្លុះបញ្ចាំងពីការស្រមើលស្រមៃ ខណៈពេលដែលស្ថិតនៅក្នុងដែនកំណត់សុវត្ថិភាព [5]

(មែនហើយ ការធ្វើទ្រង់ទ្រាយមានភាពរញ៉េរញ៉ៃបន្តិច - ដូចជាការងារខ្លួនឯងដែរ។)

មួយថ្ងៃក្នុងជីវិតរបស់គ្រូបង្វឹក AI

ដូច្នេះតើការងារពិតប្រាកដមើលទៅដូចម្ដេច? សូមគិតអំពីការសរសេរកូដដែលមិនសូវមានភាពទាក់ទាញ និងច្រើនជាងនេះ៖

ចំណាត់ថ្នាក់ចម្លើយដែលសរសេរដោយ AI ពីអាក្រក់បំផុតទៅល្អបំផុត (ជំហាន RLHF បុរាណ) [1]។.
ការជួសជុលភាពច្របូកច្របល់ (ដូចជាពេលដែលតារាម៉ូដែលភ្លេចថាភពសុក្រមិនមែនជាភពអង្គារ)។.
ការសរសេរការឆ្លើយតបរបស់ chatbot ឡើងវិញ ដើម្បីឱ្យវាស្តាប់ទៅធម្មជាតិជាង។.
ការដាក់ស្លាកអក្សរ រូបភាព ឬសំឡេងជាច្រើនប្រភេទ - ដែលភាពត្រឹមត្រូវពិតជាសំខាន់ [3]។.
ការជជែកវែកញែកថាតើ "ត្រឹមត្រូវតាមបច្ចេកទេស" គឺល្អគ្រប់គ្រាន់ឬអត់ ឬថាតើគោលការណ៍ណែនាំសុវត្ថិភាពគួរតែជំនួស [2]។.

វាជាផ្នែកមួយដែលពិបាកបន្តិច និងផ្នែកមួយទៀតជាល្បែងផ្គុំរូប។ និយាយឲ្យត្រង់ទៅ ស្រមៃមើលការបង្រៀនសេកមិនត្រឹមតែឲ្យនិយាយទេ ប៉ុន្តែឲ្យឈប់ប្រើពាក្យខុសបន្តិចបន្តួច - នោះជាអារម្មណ៍។ 🦜

ហេតុអ្វីបានជាគ្រូបង្វឹកមានសារៈសំខាន់ជាងអ្វីដែលអ្នកគិតទៅទៀត

បើគ្មានមនុស្សបើកបរទេ បញ្ញាសិប្បនិម្មិត (AI) នឹង៖

សំឡេងរឹង និងរ៉ូប៊ីណេ។.
ការរីករាលដាលនៃភាពលំអៀងដោយមិនបានត្រួតពិនិត្យ (គំនិតគួរឱ្យខ្លាច)។.
ខ្វះភាពកំប្លុកកំប្លែង ឬការយល់ចិត្តទាំងស្រុង។.
មិនសូវមានសុវត្ថិភាពក្នុងបរិបទដែលងាយរងគ្រោះ។.

គ្រូបង្វឹកគឺជាអ្នកដែលលួចចូលទៅក្នុង "របស់របររបស់មនុស្សរញ៉េរញ៉ៃ" - ពាក្យស្លោក ភាពកក់ក្តៅ ពាក្យប្រៀបធៀបដែលរញ៉េរញ៉ៃម្តងម្កាល - ខណៈពេលដែលក៏អនុវត្តរបាំងការពារដើម្បីរក្សារបស់របរឱ្យមានសុវត្ថិភាព [2][5]។.

ជំនាញដែលពិតជាមានតម្លៃ

ភ្លេចរឿងមិនពិតដែលថាអ្នកត្រូវការសញ្ញាបត្របណ្ឌិតទៅ។ អ្វីដែលជួយបានច្រើនបំផុតគឺ៖

ការសរសេរ + ការកែសម្រួល - អត្ថបទដែលបានប៉ូលាល្អ ប៉ុន្តែស្តាប់ទៅដូចធម្មជាតិ [1]។
ការគិតវិភាគ - ការរកឃើញកំហុសគំរូម្តងហើយម្តងទៀត និងការកែតម្រូវ។
ការយល់ដឹងអំពីវប្បធម៌ - ការដឹងពីពេលដែលការសរសេរឃ្លាអាចនឹងខុស [2]។
ការអត់ធ្មត់ - ពីព្រោះ AI មិនចាប់បានភ្លាមៗទេ។

ពិន្ទុបន្ថែមសម្រាប់ជំនាញនិយាយច្រើនភាសា ឬជំនាញឯកទេស។.

កន្លែងដែលគ្រូបង្វឹកកំពុងបង្ហាញខ្លួន🌍

ការងារនេះមិនមែនគ្រាន់តែជា chatbots ទេ - វាលួចចូលទៅក្នុងគ្រប់វិស័យ៖

ការថែទាំសុខភាព - ការសរសេរច្បាប់ចំណារពន្យល់សម្រាប់ករណីព្រំដែន (បានឆ្លុះបញ្ចាំងនៅក្នុងការណែនាំ AI សុខភាព) [2]។
ហិរញ្ញវត្ថុ - បណ្តុះបណ្តាលប្រព័ន្ធរកឃើញការក្លែងបន្លំដោយមិនធ្វើឱ្យមនុស្សលង់ទឹកក្នុងការជូនដំណឹងមិនពិត [2]។
លក់រាយ - ជំនួយការបង្រៀនឱ្យយល់អំពីពាក្យស្លោករបស់អ្នកទិញទំនិញ ខណៈពេលដែលប្រកាន់ខ្ជាប់នូវសម្លេងម៉ាក [5]។
ការអប់រំ - ការបង្កើតប្រព័ន្ធបង្រៀនតាមប្រព័ន្ធអេឡិចត្រូនិកឲ្យមានលក្ខណៈលើកទឹកចិត្តជំនួសឲ្យការមើលងាយ [5]។

ជាទូទៅ៖ ប្រសិនបើ AI មានកៅអីនៅតុ នោះនឹងមានគ្រូបង្វឹកលាក់ខ្លួននៅផ្ទៃខាងក្រោយ។.

ប៊ីតសីលធម៌ (មិនអាចរំលងរឿងនេះបានទេ)

នេះជាកន្លែងដែលវាក្លាយជារឿងសំខាន់។ ប្រសិនបើគ្មានការត្រួតពិនិត្យទេ បញ្ញាសិប្បនិម្មិត (AI) នឹងនិយាយឡើងវិញនូវគំរូដើម ព័ត៌មានមិនពិត ឬអ្វីដែលអាក្រក់ជាងនេះទៅទៀត។ គ្រូបង្វឹកបញ្ឈប់រឿងនោះដោយប្រើវិធីសាស្ត្រដូចជា RLHF ឬច្បាប់រដ្ឋធម្មនុញ្ញដែលដឹកនាំគំរូឆ្ពោះទៅរកចម្លើយដែលមានប្រយោជន៍ និងមិនបង្កគ្រោះថ្នាក់ [1][5]។.

ឧទាហរណ៍៖ ប្រសិនបើ bot ជំរុញអនុសាសន៍ការងារដែលលំអៀង គ្រូបង្វឹកនឹងសម្គាល់វា សរសេរសៀវភៅច្បាប់ឡើងវិញ ហើយធ្វើឱ្យប្រាកដថាវាមិនកើតឡើងម្តងទៀត។ នោះគឺជាភាពមិនប្រុងប្រយ័ត្នក្នុងសកម្មភាព [2]។.

ផ្នែកដែលមិនសូវសប្បាយ

វាមិនភ្លឺចែងចាំងទាំងអស់នោះទេ។ ស្បែកជើងប៉ាតាអាចដោះស្រាយជាមួយ៖

ភាពឯកា - ការដាក់ស្លាកគ្មានទីបញ្ចប់ក្លាយជារឿងចាស់។
អស់កម្លាំងផ្លូវចិត្ត - ការពិនិត្យឡើងវិញនូវខ្លឹមសារដែលបង្កគ្រោះថ្នាក់ ឬរំខានអាចបង្កផលប៉ះពាល់។ ប្រព័ន្ធគាំទ្រគឺមានសារៈសំខាន់ណាស់ [4]។
កង្វះការទទួលស្គាល់ - អ្នកប្រើប្រាស់កម្រដឹងថាមានគ្រូបង្វឹកណាស់។
ការផ្លាស់ប្តូរឥតឈប់ឈរ - ឧបករណ៍វិវត្តឥតឈប់ឈរ មានន័យថាគ្រូបង្វឹកត្រូវតែតាមទាន់។

យ៉ាងណាក៏ដោយ សម្រាប់មនុស្សជាច្រើន ភាពរំភើបនៃការបង្កើត «ខួរក្បាល» នៃបច្ចេកវិទ្យានៅតែធ្វើឱ្យពួកគេជាប់ចិត្ត។.

MVP ដែលលាក់កំបាំងនៃ AI

ដូច្នេះ តើអ្នកបណ្តុះបណ្តាល AI ជានរណា? ពួកគេគឺជាស្ពានរវាងក្បួនដោះស្រាយឆៅ និងប្រព័ន្ធដែល ដំណើរការ សម្រាប់មនុស្ស។ បើគ្មានពួកគេទេ AI នឹងដូចជាបណ្ណាល័យដែលគ្មានបណ្ណារក្ស - មានព័ត៌មានច្រើនសន្ធឹកសន្ធាប់ ប៉ុន្តែស្ទើរតែមិនអាចប្រើប្រាស់បាន។

លើកក្រោយ នៅពេលណាដែល chatbot ធ្វើឱ្យអ្នកសើច ឬមានអារម្មណ៍ "ស្របគ្នា" យ៉ាងគួរឱ្យភ្ញាក់ផ្អើល សូមថ្លែងអំណរគុណដល់គ្រូបង្វឹក។ ពួកគេគឺជាតួអង្គស្ងប់ស្ងាត់ដែលធ្វើឱ្យម៉ាស៊ីនមិនត្រឹមតែគណនាប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងភ្ជាប់ទំនាក់ទំនងផងដែរ [1][2][5]។.

ឯកសារយោង

[1] Ouyang, L. et al. (2022). ការបណ្តុះបណ្តាលគំរូភាសាដើម្បីអនុវត្តតាមការណែនាំជាមួយនឹងមតិប្រតិកម្មរបស់មនុស្ស (InstructGPT). NeurIPS. តំណភ្ជាប់

[2] NIST (2023). ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យបញ្ញាសិប្បនិម្មិត (AI RMF 1.0). តំណភ្ជាប់.

[3] Northcutt, C. et al. (2021)។ កំហុសស្លាកដែលរីករាលដាលនៅក្នុងសំណុំតេស្តធ្វើឱ្យស្តង់ដារសិក្សារបស់ម៉ាស៊ីនមិនស្ថិតស្ថេរ។ សំណុំទិន្នន័យ និងស្តង់ដារសិក្សារបស់ NeurIPS។ តំណភ្ជាប់

[4] WHO/ILO (2022)។ គោលការណ៍ណែនាំស្តីពីសុខភាពផ្លូវចិត្តនៅកន្លែងធ្វើការ។ តំណភ្ជាប់

[5] Bai, Y. et al. (2022). បញ្ញាសិប្បនិម្មិតតាមរដ្ឋធម្មនុញ្ញ៖ ភាពគ្មានគ្រោះថ្នាក់ពីមតិប្រតិកម្មបញ្ញាសិប្បនិម្មិត។ arXiv. តំណភ្ជាប់

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ