តើ AI ទទួលបានព័ត៌មានពីណា

តើ AI ទទួលបានព័ត៌មានរបស់វាពីណា?

ធ្លាប់អង្គុយនៅទីនោះហើយកោសក្បាលដូចជា… តើរបស់ទាំងនេះពិតជាមកពីណាមែនទេ ? ខ្ញុំចង់មានន័យថា បញ្ញាសិប្បនិម្មិត (AI) មិនមែនកំពុងរុករកតាមបណ្ណាគារដែលមានធូលីដី ឬមើលវីដេអូខ្លីៗនៅលើ YouTube ដោយមិនប្រុងប្រយ័ត្ននោះទេ។ យ៉ាងណាក៏ដោយ វាបង្កើតចម្លើយចំពោះអ្វីៗគ្រប់យ៉ាង ចាប់ពីល្បិចធ្វើម្ហូបឡាសាណា រហូតដល់រូបវិទ្យាប្រហោងខ្មៅ ដូចជាវាមានទូដាក់ឯកសារគ្មានបាតនៅខាងក្នុង។ ការពិតគឺចម្លែកជាង ហើយប្រហែលជាគួរឱ្យចាប់អារម្មណ៍ជាងអ្វីដែលអ្នកស្មាន។ ចូរយើងស្រាយវាបន្តិច (ហើយបាទ ប្រហែលជាបំបែកទេវកថាមួយចំនួនតាមផ្លូវ)។


តើវាជាអំពើអាបធ្មប់មែនទេ? 🌐

វាមិនមែនជាអំពើអាបធ្មប់ទេ ទោះបីជាពេលខ្លះវាមានអារម្មណ៍បែបនោះក៏ដោយ។ អ្វីដែលកំពុងកើតឡើងនៅក្រោមក្រណាត់គឺជា ការទស្សន៍ទាយ ។ គំរូភាសាធំៗ (LLMs) មិន រក្សាទុកការពិត តាមរបៀបដែលខួរក្បាលរបស់អ្នកកាន់តាមរូបមន្តខូឃីរបស់ជីដូនរបស់អ្នកទេ។ ផ្ទុយទៅវិញ ពួកគេត្រូវបានបណ្តុះបណ្តាលឱ្យទាយពាក្យបន្ទាប់ (ថូខឹន) ដោយផ្អែកលើអ្វីដែលមានមុន [2]។ នៅក្នុងការអនុវត្ត នោះមានន័យថាពួកគេតោងជាប់នឹងទំនាក់ទំនង៖ ពាក្យណាដែលនៅជាប់គ្នា របៀបដែលប្រយោគជាធម្មតាមានរូបរាង របៀបដែលគំនិតទាំងមូលត្រូវបានបង្កើតឡើងដូចជារនាំង។ នោះហើយជាមូលហេតុដែលលទ្ធផល ស្តាប់ទៅ ត្រឹមត្រូវ ទោះបីជា - ភាពស្មោះត្រង់ទាំងស្រុង - វាជាការធ្វើត្រាប់តាមស្ថិតិ មិនមែនការយល់ដឹងទេ [4]។

ដូច្នេះតើអ្វីដែលធ្វើឱ្យព័ត៌មានដែលបង្កើតដោយ AI មានប្រយោជន៍ ? មានរឿងមួយចំនួន៖

  • ភាពចម្រុះនៃទិន្នន័យ - ទាញយកពីប្រភពរាប់មិនអស់ មិនមែនពីចរន្តតូចចង្អៀតតែមួយទេ។

  • ការអាប់ដេត - បើគ្មានវដ្តនៃការធ្វើឱ្យស្រស់ឡើងវិញទេ វានឹងខូចយ៉ាងឆាប់រហ័ស។

  • ការច្រោះ - តាមឧត្ដមគតិគឺចាប់សំរាមមុនពេលវាជ្រាបចូល (ទោះជាយ៉ាងណាក៏ដោយ ចូរនិយាយឱ្យត្រង់ទៅ សំណាញ់នោះមានរន្ធ)។

  • ការត្រួតពិនិត្យឆ្លង - ពឹងផ្អែកលើប្រភពអាជ្ញាធរ (ដូចជា NASA, WHO, សាកលវិទ្យាល័យធំៗ) ដែលជាកត្តាចាំបាច់នៅក្នុងសៀវភៅណែនាំអភិបាលកិច្ច AI ភាគច្រើន [3]។

យ៉ាងណាក៏ដោយ ពេលខ្លះវាបង្កើតឡើងដោយមានទំនុកចិត្ត។ អ្វីដែលហៅថា ការយល់ច្រឡំ ? ជាទូទៅ គឺជារឿងមិនសមហេតុផលដែលត្រូវបានប៉ូលាដោយទឹកមុខត្រង់ [2][3]។

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 តើ AI អាចទស្សន៍ទាយលេខឆ្នោតបានទេ?
ស្វែងយល់ពីទេវកថា និងការពិតអំពីការទស្សន៍ទាយឆ្នោតដោយ AI។.

🔗 តើវាមានន័យយ៉ាងណាក្នុងការប្រើវិធីសាស្រ្តរួមចំពោះ AI
ការយល់ដឹងអំពី AI ជាមួយនឹងទស្សនៈមានតុល្យភាពលើក្រមសីលធម៌ និងផលប៉ះពាល់។.

🔗 តើព្រះគម្ពីរចែងយ៉ាងណាអំពីបញ្ញាសិប្បនិម្មិត
ការពិនិត្យមើលទស្សនៈព្រះគម្ពីរលើបច្ចេកវិទ្យា និងការបង្កើតមនុស្ស។.


ការប្រៀបធៀបរហ័ស៖ កន្លែងដែល AI ទាញយកពី 📊

មិនមែនគ្រប់ប្រភពទាំងអស់សុទ្ធតែដូចគ្នានោះទេ ប៉ុន្តែប្រភពនីមួយៗដើរតួនាទីរបស់វា។ នេះជាទិដ្ឋភាពសង្ខេប។.

ប្រភេទប្រភព អ្នកណាប្រើប្រាស់វា (AI) តម្លៃ/តម្លៃ ហេតុអ្វីបានជាវាដំណើរការ (ឬមិនដំណើរការ...)
សៀវភៅ និងអត្ថបទ គំរូភាសាធំៗ គ្មានតម្លៃ (អ៊ី) ចំណេះដឹងក្រាស់ និងមានរចនាសម្ព័ន្ធ - គ្រាន់តែចាស់ទៅយ៉ាងឆាប់រហ័ស។.
គេហទំព័រ និងប្លក់ ស្ទើរតែទាំងអស់នៃ AI ឥតគិតថ្លៃ (មានសំឡេងរំខាន) ពូជព្រៃ; ល្បាយនៃភាពអស្ចារ្យ និងសំរាមដាច់ខាត។.
ឯកសារសិក្សា បញ្ញាសិប្បនិម្មិត (AIs) ដែលផ្តោតលើការស្រាវជ្រាវខ្លាំង ពេលខ្លះ​មាន​ការបង់ប្រាក់​តាម​ជញ្ជាំង ភាពម៉ត់ចត់ + ភាពជឿជាក់ ប៉ុន្តែត្រូវបានគ្របដណ្ដប់ដោយពាក្យស្លោកធ្ងន់ធ្ងរ។.
ទិន្នន័យអ្នកប្រើប្រាស់ បញ្ញាសិប្បនិម្មិតផ្ទាល់ខ្លួន ងាយប្រតិកម្មខ្លាំង ⚠️ ការ​កាត់ដេរ​យ៉ាង​ម៉ត់ចត់ ប៉ុន្តែ​មាន​បញ្ហា​ឯកជនភាព​ច្រើន។.
បណ្ដាញ​ពេលវេលា​ជាក់ស្តែង AI ដែលភ្ជាប់ជាមួយការស្វែងរក ឥតគិតថ្លៃ (ប្រសិនបើមានអ៊ីនធឺណិត) រក្សាព័ត៌មានឱ្យនៅថ្មីជានិច្ច; ចំណុចអវិជ្ជមានគឺហានិភ័យនៃការពង្រីកពាក្យចចាមអារ៉ាម។.

សកលលោកទិន្នន័យបណ្តុះបណ្តាល🌌

នេះគឺជាដំណាក់កាល "ការរៀនសូត្រពីកុមារភាព"។ ស្រមៃមើលការប្រគល់ ខ្លីៗ និងរន្ធទន្សាយរបស់ Wikipedia ដល់កុមារម្នាក់ក្នុងពេលតែមួយ។ នោះហើយជាអ្វីដែលការបណ្តុះបណ្តាលជាមុនមើលទៅ។ នៅក្នុងពិភពពិត អ្នកផ្តល់សេវាដាក់បញ្ចូលគ្នានូវ ទិន្នន័យដែលមានជាសាធារណៈ ប្រភពដែលមានអាជ្ញាប័ណ្ណ និងអត្ថបទដែលបង្កើតឡើងដោយគ្រូបង្វឹក [2]។

ដាក់ជាស្រទាប់ៗនៅខាងលើ៖ ឧទាហរណ៍មនុស្សដែលបានរៀបចំយ៉ាងល្អ - ចម្លើយល្អ ចម្លើយអាក្រក់ ការជំរុញទៅក្នុងទិសដៅត្រឹមត្រូវ - មុនពេលការពង្រឹងចាប់ផ្តើម [1]។.

ការព្រមានអំពីតម្លាភាព៖ ក្រុមហ៊ុនមិនបង្ហាញរាល់ព័ត៌មានលម្អិតទេ។ របាំងការពារមួយចំនួនគឺជាការសម្ងាត់ (IP ការព្រួយបារម្ភអំពីសុវត្ថិភាព) ដូច្នេះអ្នកទទួលបានតែបង្អួចមួយផ្នែកប៉ុណ្ណោះចំពោះការលាយបញ្ចូលគ្នាពិតប្រាកដ [2]។.


ការស្វែងរកតាមពេលវេលាជាក់ស្តែង៖ គ្រឿងបន្ថែម 🍒

ម៉ូដែលមួយចំនួនឥឡូវនេះអាចមើលចេញពីពពុះហ្វឹកហាត់របស់ពួកគេបាន។ នោះគឺជា ការបង្កើតឡើងវិញ-បង្កើន (RAG) - ជាទូទៅទាញយកបំណែកពីសន្ទស្សន៍ផ្ទាល់ ឬហាងឯកសារ បន្ទាប់មកបញ្ចូលវាទៅក្នុងការឆ្លើយតប [5]។ ល្អឥតខ្ចោះសម្រាប់របស់ដែលមានការផ្លាស់ប្តូរយ៉ាងឆាប់រហ័សដូចជាចំណងជើងព័ត៌មាន ឬតម្លៃភាគហ៊ុន។

ចំណុចខ្វះខាត? អ៊ីនធឺណិតមានទាំងភាពប៉ិនប្រសប់ និងភាពមិនស្មោះត្រង់។ ប្រសិនបើតម្រង ឬការត្រួតពិនិត្យប្រភពខ្សោយ អ្នកប្រឈមនឹងហានិភ័យនៃការលួចចូលទិន្នន័យឥតបានការ ដូចដែលក្របខ័ណ្ឌហានិភ័យបានព្រមាន [3]។.

ដំណោះស្រាយទូទៅមួយ៖ ក្រុមហ៊ុននានាភ្ជាប់គំរូទៅនឹង របស់ពួកគេ ដូច្នេះចម្លើយដកស្រង់គោលការណ៍ធនធានមនុស្សបច្ចុប្បន្ន ឬឯកសារផលិតផលដែលបានធ្វើបច្ចុប្បន្នភាពជំនួសឱ្យការនិយាយបំផ្លើស។ សូមគិតថា៖ ពេលវេលា "អឺ-អូ" តិចជាងមុន ការឆ្លើយតបកាន់តែគួរឱ្យទុកចិត្ត។


ការលៃតម្រូវល្អិតល្អន់៖ ជំហានកែលម្អរបស់ AI 🧪

ម៉ូដែលឆៅដែលបានទទួលការបណ្តុះបណ្តាលជាមុនគឺមានភាពរញ៉េរញ៉ៃ។ ដូច្នេះពួកវាត្រូវបាន លៃតម្រូវយ៉ាងល្អិតល្អន់

  • ការបង្រៀនពួកគេឱ្យចេះ ជួយគ្នា មិនបង្កគ្រោះថ្នាក់ និងស្មោះត្រង់ (តាមរយៈការរៀនសូត្រពីមតិកែលម្អរបស់មនុស្ស RLHF) [1]។

  • កំពុងខាត់គែមដែលមិនមានសុវត្ថិភាព ឬមានជាតិពុល (តម្រឹម) [1]។.

  • ការកែតម្រូវសម្លេង - មិនថាវារួសរាយរាក់ទាក់ ផ្លូវការ ឬការចំអកលេងសើចនោះទេ។.

វាមិនមែនជាការប៉ូលាពេជ្រនោះទេ ប៉ុន្តែវាជាការធ្វើឲ្យការរអិលបាក់ដីខាងស្ថិតិមានឥរិយាបទដូចជាដៃគូសន្ទនា។.


ឧបសគ្គ និងការបរាជ័យ🚧

កុំ​ធ្វើ​ពុត​ថា​វា​ឥតខ្ចោះ​៖

  • ការយល់ច្រឡំ - ចម្លើយច្បាស់លាស់ដែលខុសទាំងស្រុង [2][3]។

  • ភាពលំអៀង - វាឆ្លុះបញ្ចាំងពីលំនាំដែលបានបង្កប់នៅក្នុងទិន្នន័យ; ថែមទាំងអាចពង្រីកពួកវាបានទៀតផង ប្រសិនបើមិនត្រូវបានធីក [3][4]។

  • គ្មានបទពិសោធន៍ផ្ទាល់ទេ - វាអាច និយាយ អំពីរូបមន្តស៊ុប ប៉ុន្តែមិនដែលភ្លក់វាទេ [4]។

  • ទំនុកចិត្តលើសលប់ - អត្ថបទសរសេរហូរដូចដែលវាដឹង សូម្បីតែពេលដែលវាមិនដឹងក៏ដោយ។ ក្របខ័ណ្ឌហានិភ័យសង្កត់ធ្ងន់លើការសន្មត់ដែលបង្ហាញពីការសម្គាល់ [3]។


ហេតុអ្វីបានជាវា មានអារម្មណ៍ ដូចជាដឹង 🧠

វាគ្មានជំនឿ គ្មានការចងចាំក្នុងន័យរបស់មនុស្សទេ ហើយពិតជាគ្មានខ្លួនឯងទេ។ យ៉ាងណាក៏ដោយ ដោយសារតែវាចងក្រងប្រយោគជាមួយគ្នាយ៉ាងរលូន ខួរក្បាលរបស់អ្នកអានវាដូចជាវា យល់ ។ អ្វីដែលកំពុងកើតឡើងគឺគ្រាន់តែ ជាការទស្សន៍ទាយបន្ទាប់ទ្រង់ទ្រាយធំ ៖ ការគណនាប្រូបាប៊ីលីតេរាប់ពាន់លានក្នុងរយៈពេលប៉ុន្មានវិនាទីប៉ុណ្ណោះ [2]។

“សេកស្តូកាស្ទិក” [4] ដោយនិយាយបែបចំអកបន្តិច


ការប្រៀបធៀបសម្រាប់កុមារ 🎨

ស្រមៃមើលសេកមួយក្បាលដែលបានអានសៀវភៅគ្រប់ក្បាលនៅក្នុងបណ្ណាល័យ។ វាមិន យល់ រឿងរ៉ាវទេ ប៉ុន្តែអាចលាយពាក្យពេចន៍ទៅជាអ្វីមួយដែលមានអារម្មណ៍ថាមានប្រាជ្ញា។ ពេលខ្លះវាត្រឹមត្រូវ ពេលខ្លះវាមិនសមហេតុផល ប៉ុន្តែជាមួយនឹងភាពប៉ិនប្រសប់គ្រប់គ្រាន់ អ្នកមិនអាចប្រាប់ពីភាពខុសគ្នាជានិច្ចនោះទេ។


សរុបមក៖ កន្លែងដែលព័ត៌មានរបស់ AI មកពីណា📌

និយាយឱ្យសាមញ្ញ៖

  • ទិន្នន័យបណ្តុះបណ្តាលយ៉ាងច្រើន (សាធារណៈ + មានអាជ្ញាប័ណ្ណ + បង្កើតដោយគ្រូបង្វឹក) [2]។

  • ការលៃតម្រូវយ៉ាងល្អិតល្អន់ ជាមួយនឹងមតិប្រតិកម្មរបស់មនុស្សដើម្បីបង្កើតជាសម្លេង/ឥរិយាបថ [1]។

  • ប្រព័ន្ធទាញយក នៅពេលភ្ជាប់ទៅនឹងស្ទ្រីមទិន្នន័យផ្ទាល់ [5]។

បញ្ញាសិប្បនិម្មិត (AI) មិនដឹងអ្វីទេ - វា ទស្សន៍ទាយអត្ថបទ ។ នោះគឺជាមហាអំណាច និងជាចំណុចខ្សោយរបស់វា។ សរុបមក? តែងតែពិនិត្យមើលរឿងសំខាន់ៗជាមួយប្រភពដែលគួរឱ្យទុកចិត្ត [3]។


ឯកសារយោង

  1. Ouyang, L. et al. (2022). ការបណ្តុះបណ្តាលគំរូភាសាដើម្បីអនុវត្តតាមការណែនាំជាមួយនឹងមតិប្រតិកម្មរបស់មនុស្ស (InstructGPT) . arXiv .

  2. OpenAI (2023)។ របាយការណ៍បច្ចេកទេស GPT-4 - ល្បាយនៃទិន្នន័យដែលមានអាជ្ញាប័ណ្ណ សាធារណៈ និងបង្កើតឡើងដោយមនុស្ស។ គោលបំណង និងដែនកំណត់នៃការព្យាករណ៍សញ្ញាបន្ទាប់។ arXiv

  3. NIST (2023). ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យ AI (AI RMF 1.0) - ប្រភព ភាពជឿទុកចិត្ត និងការគ្រប់គ្រងហានិភ័យ។ PDF

  4. Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). ស្តីពីគ្រោះថ្នាក់នៃសេកស្តូកាស្ទិក៖ តើគំរូភាសាអាចធំពេកបានទេ? PDF .

  5. Lewis, P. et al. (2020). ការបង្កើត​ដែល​បាន​បង្កើន​ការ​ទាញ​យក​សម្រាប់ NLP ដែល​ពឹងផ្អែក​លើ​ចំណេះដឹងarXiv .


ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ