តើ AI ទទួលបានព័ត៌មានរបស់វាពីណា?

ធ្លាប់អង្គុយនៅទីនោះហើយកោសក្បាលដូចជា… តើរបស់ទាំងនេះពិតជាមកពីណាមែនទេ ? ខ្ញុំចង់មានន័យថា បញ្ញាសិប្បនិម្មិត (AI) មិនមែនកំពុងរុករកតាមបណ្ណាគារដែលមានធូលីដី ឬមើលវីដេអូខ្លីៗនៅលើ YouTube ដោយមិនប្រុងប្រយ័ត្ននោះទេ។ យ៉ាងណាក៏ដោយ វាបង្កើតចម្លើយចំពោះអ្វីៗគ្រប់យ៉ាង ចាប់ពីល្បិចធ្វើម្ហូបឡាសាណា រហូតដល់រូបវិទ្យាប្រហោងខ្មៅ ដូចជាវាមានទូដាក់ឯកសារគ្មានបាតនៅខាងក្នុង។ ការពិតគឺចម្លែកជាង ហើយប្រហែលជាគួរឱ្យចាប់អារម្មណ៍ជាងអ្វីដែលអ្នកស្មាន។ ចូរយើងស្រាយវាបន្តិច (ហើយបាទ ប្រហែលជាបំបែកទេវកថាមួយចំនួនតាមផ្លូវ)។

តើវាជាអំពើអាបធ្មប់មែនទេ? 🌐

វាមិនមែនជាអំពើអាបធ្មប់ទេ ទោះបីជាពេលខ្លះវាមានអារម្មណ៍បែបនោះក៏ដោយ។ អ្វីដែលកំពុងកើតឡើងនៅក្រោមក្រណាត់គឺជា ការទស្សន៍ទាយ ។ គំរូភាសាធំៗ (LLMs) មិន រក្សាទុកការពិត តាមរបៀបដែលខួរក្បាលរបស់អ្នកកាន់តាមរូបមន្តខូឃីរបស់ជីដូនរបស់អ្នកទេ។ ផ្ទុយទៅវិញ ពួកគេត្រូវបានបណ្តុះបណ្តាលឱ្យទាយពាក្យបន្ទាប់ (ថូខឹន) ដោយផ្អែកលើអ្វីដែលមានមុន [2]។ នៅក្នុងការអនុវត្ត នោះមានន័យថាពួកគេតោងជាប់នឹងទំនាក់ទំនង៖ ពាក្យណាដែលនៅជាប់គ្នា របៀបដែលប្រយោគជាធម្មតាមានរូបរាង របៀបដែលគំនិតទាំងមូលត្រូវបានបង្កើតឡើងដូចជារនាំង។ នោះហើយជាមូលហេតុដែលលទ្ធផល ស្តាប់ទៅ ត្រឹមត្រូវ ទោះបីជា - ភាពស្មោះត្រង់ទាំងស្រុង - វាជាការធ្វើត្រាប់តាមស្ថិតិ មិនមែនការយល់ដឹងទេ [4]។

ដូច្នេះតើអ្វីដែលធ្វើឱ្យព័ត៌មានដែលបង្កើតដោយ AI មានប្រយោជន៍ ? មានរឿងមួយចំនួន៖

ភាពចម្រុះនៃទិន្នន័យ - ទាញយកពីប្រភពរាប់មិនអស់ មិនមែនពីចរន្តតូចចង្អៀតតែមួយទេ។
ការអាប់ដេត - បើគ្មានវដ្តនៃការធ្វើឱ្យស្រស់ឡើងវិញទេ វានឹងខូចយ៉ាងឆាប់រហ័ស។
ការច្រោះ - តាមឧត្ដមគតិគឺចាប់សំរាមមុនពេលវាជ្រាបចូល (ទោះជាយ៉ាងណាក៏ដោយ ចូរនិយាយឱ្យត្រង់ទៅ សំណាញ់នោះមានរន្ធ)។
ការត្រួតពិនិត្យឆ្លង - ពឹងផ្អែកលើប្រភពអាជ្ញាធរ (ដូចជា NASA, WHO, សាកលវិទ្យាល័យធំៗ) ដែលជាកត្តាចាំបាច់នៅក្នុងសៀវភៅណែនាំអភិបាលកិច្ច AI ភាគច្រើន [3]។

យ៉ាងណាក៏ដោយ ពេលខ្លះវាបង្កើតឡើងដោយមានទំនុកចិត្ត។ អ្វីដែលហៅថា ការយល់ច្រឡំ ? ជាទូទៅ គឺជារឿងមិនសមហេតុផលដែលត្រូវបានប៉ូលាដោយទឹកមុខត្រង់ [2][3]។

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 តើ AI អាចទស្សន៍ទាយលេខឆ្នោតបានទេ?
ស្វែងយល់ពីទេវកថា និងការពិតអំពីការទស្សន៍ទាយឆ្នោតដោយ AI។.

🔗 តើវាមានន័យយ៉ាងណាក្នុងការប្រើវិធីសាស្រ្តរួមចំពោះ AI
ការយល់ដឹងអំពី AI ជាមួយនឹងទស្សនៈមានតុល្យភាពលើក្រមសីលធម៌ និងផលប៉ះពាល់។.

🔗 តើព្រះគម្ពីរចែងយ៉ាងណាអំពីបញ្ញាសិប្បនិម្មិត
ការពិនិត្យមើលទស្សនៈព្រះគម្ពីរលើបច្ចេកវិទ្យា និងការបង្កើតមនុស្ស។.

ការប្រៀបធៀបរហ័ស៖ កន្លែងដែល AI ទាញយកពី 📊

មិនមែនគ្រប់ប្រភពទាំងអស់សុទ្ធតែដូចគ្នានោះទេ ប៉ុន្តែប្រភពនីមួយៗដើរតួនាទីរបស់វា។ នេះជាទិដ្ឋភាពសង្ខេប។.

ប្រភេទប្រភព	អ្នកណាប្រើប្រាស់វា (AI)	តម្លៃ/តម្លៃ	ហេតុអ្វីបានជាវាដំណើរការ (ឬមិនដំណើរការ...)
សៀវភៅ និងអត្ថបទ	គំរូភាសាធំៗ	គ្មានតម្លៃ (អ៊ី)	ចំណេះដឹងក្រាស់ និងមានរចនាសម្ព័ន្ធ - គ្រាន់តែចាស់ទៅយ៉ាងឆាប់រហ័ស។.
គេហទំព័រ និងប្លក់	ស្ទើរតែទាំងអស់នៃ AI	ឥតគិតថ្លៃ (មានសំឡេងរំខាន)	ពូជព្រៃ; ល្បាយនៃភាពអស្ចារ្យ និងសំរាមដាច់ខាត។.
ឯកសារសិក្សា	បញ្ញាសិប្បនិម្មិត (AIs) ដែលផ្តោតលើការស្រាវជ្រាវខ្លាំង	ពេលខ្លះមានការបង់ប្រាក់តាមជញ្ជាំង	ភាពម៉ត់ចត់ + ភាពជឿជាក់ ប៉ុន្តែត្រូវបានគ្របដណ្ដប់ដោយពាក្យស្លោកធ្ងន់ធ្ងរ។.
ទិន្នន័យអ្នកប្រើប្រាស់	បញ្ញាសិប្បនិម្មិតផ្ទាល់ខ្លួន	ងាយប្រតិកម្មខ្លាំង ⚠️	ការកាត់ដេរយ៉ាងម៉ត់ចត់ ប៉ុន្តែមានបញ្ហាឯកជនភាពច្រើន។.
បណ្ដាញពេលវេលាជាក់ស្តែង	AI ដែលភ្ជាប់ជាមួយការស្វែងរក	ឥតគិតថ្លៃ (ប្រសិនបើមានអ៊ីនធឺណិត)	រក្សាព័ត៌មានឱ្យនៅថ្មីជានិច្ច; ចំណុចអវិជ្ជមានគឺហានិភ័យនៃការពង្រីកពាក្យចចាមអារ៉ាម។.

សកលលោកទិន្នន័យបណ្តុះបណ្តាល🌌

នេះគឺជាដំណាក់កាល "ការរៀនសូត្រពីកុមារភាព"។ ស្រមៃមើលការប្រគល់ ខ្លីៗ និងរន្ធទន្សាយរបស់ Wikipedia ដល់កុមារម្នាក់ក្នុងពេលតែមួយ។ នោះហើយជាអ្វីដែលការបណ្តុះបណ្តាលជាមុនមើលទៅ។ នៅក្នុងពិភពពិត អ្នកផ្តល់សេវាដាក់បញ្ចូលគ្នានូវ ទិន្នន័យដែលមានជាសាធារណៈ ប្រភពដែលមានអាជ្ញាប័ណ្ណ និងអត្ថបទដែលបង្កើតឡើងដោយគ្រូបង្វឹក [2]។

ដាក់ជាស្រទាប់ៗនៅខាងលើ៖ ឧទាហរណ៍មនុស្សដែលបានរៀបចំយ៉ាងល្អ - ចម្លើយល្អ ចម្លើយអាក្រក់ ការជំរុញទៅក្នុងទិសដៅត្រឹមត្រូវ - មុនពេលការពង្រឹងចាប់ផ្តើម [1]។.

ការព្រមានអំពីតម្លាភាព៖ ក្រុមហ៊ុនមិនបង្ហាញរាល់ព័ត៌មានលម្អិតទេ។ របាំងការពារមួយចំនួនគឺជាការសម្ងាត់ (IP ការព្រួយបារម្ភអំពីសុវត្ថិភាព) ដូច្នេះអ្នកទទួលបានតែបង្អួចមួយផ្នែកប៉ុណ្ណោះចំពោះការលាយបញ្ចូលគ្នាពិតប្រាកដ [2]។.

ការស្វែងរកតាមពេលវេលាជាក់ស្តែង៖ គ្រឿងបន្ថែម 🍒

ម៉ូដែលមួយចំនួនឥឡូវនេះអាចមើលចេញពីពពុះហ្វឹកហាត់របស់ពួកគេបាន។ នោះគឺជា ការបង្កើតឡើងវិញ-បង្កើន (RAG) - ជាទូទៅទាញយកបំណែកពីសន្ទស្សន៍ផ្ទាល់ ឬហាងឯកសារ បន្ទាប់មកបញ្ចូលវាទៅក្នុងការឆ្លើយតប [5]។ ល្អឥតខ្ចោះសម្រាប់របស់ដែលមានការផ្លាស់ប្តូរយ៉ាងឆាប់រហ័សដូចជាចំណងជើងព័ត៌មាន ឬតម្លៃភាគហ៊ុន។

ចំណុចខ្វះខាត? អ៊ីនធឺណិតមានទាំងភាពប៉ិនប្រសប់ និងភាពមិនស្មោះត្រង់។ ប្រសិនបើតម្រង ឬការត្រួតពិនិត្យប្រភពខ្សោយ អ្នកប្រឈមនឹងហានិភ័យនៃការលួចចូលទិន្នន័យឥតបានការ ដូចដែលក្របខ័ណ្ឌហានិភ័យបានព្រមាន [3]។.

ដំណោះស្រាយទូទៅមួយ៖ ក្រុមហ៊ុននានាភ្ជាប់គំរូទៅនឹង របស់ពួកគេ ដូច្នេះចម្លើយដកស្រង់គោលការណ៍ធនធានមនុស្សបច្ចុប្បន្ន ឬឯកសារផលិតផលដែលបានធ្វើបច្ចុប្បន្នភាពជំនួសឱ្យការនិយាយបំផ្លើស។ សូមគិតថា៖ ពេលវេលា "អឺ-អូ" តិចជាងមុន ការឆ្លើយតបកាន់តែគួរឱ្យទុកចិត្ត។

ការលៃតម្រូវល្អិតល្អន់៖ ជំហានកែលម្អរបស់ AI 🧪

ម៉ូដែលឆៅដែលបានទទួលការបណ្តុះបណ្តាលជាមុនគឺមានភាពរញ៉េរញ៉ៃ។ ដូច្នេះពួកវាត្រូវបាន លៃតម្រូវយ៉ាងល្អិតល្អន់ ៖

ការបង្រៀនពួកគេឱ្យចេះ ជួយគ្នា មិនបង្កគ្រោះថ្នាក់ និងស្មោះត្រង់ (តាមរយៈការរៀនសូត្រពីមតិកែលម្អរបស់មនុស្ស RLHF) [1]។
កំពុងខាត់គែមដែលមិនមានសុវត្ថិភាព ឬមានជាតិពុល (តម្រឹម) [1]។.
ការកែតម្រូវសម្លេង - មិនថាវារួសរាយរាក់ទាក់ ផ្លូវការ ឬការចំអកលេងសើចនោះទេ។.

វាមិនមែនជាការប៉ូលាពេជ្រនោះទេ ប៉ុន្តែវាជាការធ្វើឲ្យការរអិលបាក់ដីខាងស្ថិតិមានឥរិយាបទដូចជាដៃគូសន្ទនា។.

ឧបសគ្គ និងការបរាជ័យ🚧

កុំធ្វើពុតថាវាឥតខ្ចោះ៖

ការយល់ច្រឡំ - ចម្លើយច្បាស់លាស់ដែលខុសទាំងស្រុង [2][3]។
ភាពលំអៀង - វាឆ្លុះបញ្ចាំងពីលំនាំដែលបានបង្កប់នៅក្នុងទិន្នន័យ; ថែមទាំងអាចពង្រីកពួកវាបានទៀតផង ប្រសិនបើមិនត្រូវបានធីក [3][4]។
គ្មានបទពិសោធន៍ផ្ទាល់ទេ - វាអាច និយាយ អំពីរូបមន្តស៊ុប ប៉ុន្តែមិនដែលភ្លក់វាទេ [4]។
ទំនុកចិត្តលើសលប់ - អត្ថបទសរសេរហូរដូចដែលវាដឹង សូម្បីតែពេលដែលវាមិនដឹងក៏ដោយ។ ក្របខ័ណ្ឌហានិភ័យសង្កត់ធ្ងន់លើការសន្មត់ដែលបង្ហាញពីការសម្គាល់ [3]។

ហេតុអ្វីបានជាវា មានអារម្មណ៍ ដូចជាដឹង 🧠

វាគ្មានជំនឿ គ្មានការចងចាំក្នុងន័យរបស់មនុស្សទេ ហើយពិតជាគ្មានខ្លួនឯងទេ។ យ៉ាងណាក៏ដោយ ដោយសារតែវាចងក្រងប្រយោគជាមួយគ្នាយ៉ាងរលូន ខួរក្បាលរបស់អ្នកអានវាដូចជាវា យល់ ។ អ្វីដែលកំពុងកើតឡើងគឺគ្រាន់តែ ជាការទស្សន៍ទាយបន្ទាប់ទ្រង់ទ្រាយធំ ៖ ការគណនាប្រូបាប៊ីលីតេរាប់ពាន់លានក្នុងរយៈពេលប៉ុន្មានវិនាទីប៉ុណ្ណោះ [2]។

“សេកស្តូកាស្ទិក” [4] ដោយនិយាយបែបចំអកបន្តិច

ការប្រៀបធៀបសម្រាប់កុមារ 🎨

ស្រមៃមើលសេកមួយក្បាលដែលបានអានសៀវភៅគ្រប់ក្បាលនៅក្នុងបណ្ណាល័យ។ វាមិន យល់ រឿងរ៉ាវទេ ប៉ុន្តែអាចលាយពាក្យពេចន៍ទៅជាអ្វីមួយដែលមានអារម្មណ៍ថាមានប្រាជ្ញា។ ពេលខ្លះវាត្រឹមត្រូវ ពេលខ្លះវាមិនសមហេតុផល ប៉ុន្តែជាមួយនឹងភាពប៉ិនប្រសប់គ្រប់គ្រាន់ អ្នកមិនអាចប្រាប់ពីភាពខុសគ្នាជានិច្ចនោះទេ។

សរុបមក៖ កន្លែងដែលព័ត៌មានរបស់ AI មកពីណា📌

និយាយឱ្យសាមញ្ញ៖

ទិន្នន័យបណ្តុះបណ្តាលយ៉ាងច្រើន (សាធារណៈ + មានអាជ្ញាប័ណ្ណ + បង្កើតដោយគ្រូបង្វឹក) [2]។
ការលៃតម្រូវយ៉ាងល្អិតល្អន់ ជាមួយនឹងមតិប្រតិកម្មរបស់មនុស្សដើម្បីបង្កើតជាសម្លេង/ឥរិយាបថ [1]។
ប្រព័ន្ធទាញយក នៅពេលភ្ជាប់ទៅនឹងស្ទ្រីមទិន្នន័យផ្ទាល់ [5]។

បញ្ញាសិប្បនិម្មិត (AI) មិនដឹងអ្វីទេ - វា ទស្សន៍ទាយអត្ថបទ ។ នោះគឺជាមហាអំណាច និងជាចំណុចខ្សោយរបស់វា។ សរុបមក? តែងតែពិនិត្យមើលរឿងសំខាន់ៗជាមួយប្រភពដែលគួរឱ្យទុកចិត្ត [3]។

ឯកសារយោង

Ouyang, L. et al. (2022). ការបណ្តុះបណ្តាលគំរូភាសាដើម្បីអនុវត្តតាមការណែនាំជាមួយនឹងមតិប្រតិកម្មរបស់មនុស្ស (InstructGPT) . arXiv .
OpenAI (2023)។ របាយការណ៍បច្ចេកទេស GPT-4 - ល្បាយនៃទិន្នន័យដែលមានអាជ្ញាប័ណ្ណ សាធារណៈ និងបង្កើតឡើងដោយមនុស្ស។ គោលបំណង និងដែនកំណត់នៃការព្យាករណ៍សញ្ញាបន្ទាប់។ arXiv ។
NIST (2023). ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យ AI (AI RMF 1.0) - ប្រភព ភាពជឿទុកចិត្ត និងការគ្រប់គ្រងហានិភ័យ។ PDF ។
Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). ស្តីពីគ្រោះថ្នាក់នៃសេកស្តូកាស្ទិក៖ តើគំរូភាសាអាចធំពេកបានទេ? PDF .
Lewis, P. et al. (2020). ការបង្កើតដែលបានបង្កើនការទាញយកសម្រាប់ NLP ដែលពឹងផ្អែកលើចំណេះដឹង ។ arXiv .

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ

ប្រទេស/តំបន់