តើ​គំរូ​គ្រឹះ​នៅ​ក្នុង​ AI ​ដែល​បង្កើត​ឡើង​មាន​អ្វី​ខ្លះ?

តើ​គំរូ​គ្រឹះ​នៅ​ក្នុង​ AI ​ដែល​បង្កើត​ឡើង​មាន​អ្វី​ខ្លះ?

ចម្លើយខ្លី៖ គំរូគ្រឹះគឺជាគំរូ AI ធំៗ ដែលមានគោលបំណងទូទៅ ដែលត្រូវបានបណ្តុះបណ្តាលលើសំណុំទិន្នន័យដ៏ធំទូលាយ បន្ទាប់មកត្រូវបានសម្របខ្លួនទៅនឹងការងារជាច្រើន (ការសរសេរ ការស្វែងរក ការសរសេរកូដ រូបភាព) តាមរយៈការជំរុញ ការលៃតម្រូវ ឧបករណ៍ ឬការទាញយកមកវិញ។ ប្រសិនបើអ្នកត្រូវការចម្លើយដែលអាចទុកចិត្តបាន សូមផ្គូផ្គងពួកវាជាមួយនឹងការធ្វើមូលដ្ឋាន (ដូចជា RAG) ការរឹតបន្តឹងច្បាស់លាស់ និងការត្រួតពិនិត្យ ជាជាងការអនុញ្ញាតឱ្យពួកគេបង្កើតថ្មី។

ចំណុចសំខាន់ៗ៖

និយមន័យ ៖ គំរូមូលដ្ឋានដែលបានទទួលការបណ្តុះបណ្តាលយ៉ាងទូលំទូលាយមួយ ដែលត្រូវបានប្រើប្រាស់ឡើងវិញលើកិច្ចការជាច្រើន មិនមែនមួយភារកិច្ចក្នុងមួយគំរូនោះទេ។

ការសម្របខ្លួន ៖ ប្រើការជំរុញ ការលៃតម្រូវល្អិតល្អន់ LoRA/អាដាប់ទ័រ RAG និងឧបករណ៍ដើម្បីគ្រប់គ្រងឥរិយាបថ។

ភាពសមស្រប​សម្រាប់​ការបង្កើត ៖ ពួកវា​ផ្តល់​ថាមពល​ដល់​ការបង្កើត​អត្ថបទ រូបភាព អូឌីយ៉ូ កូដ និង​ការបង្កើត​ខ្លឹមសារ​ពហុម៉ូឌុល។

សញ្ញាគុណភាព ៖ ផ្តល់អាទិភាពដល់ការគ្រប់គ្រង ការយល់ច្រឡំតិចជាងមុន សមត្ថភាពពហុមធ្យោបាយ និងការសន្និដ្ឋានប្រកបដោយប្រសិទ្ធភាព។

ការគ្រប់គ្រងហានិភ័យ ៖ ផែនការសម្រាប់ការយល់ច្រឡំ ការលំអៀង ការលេចធ្លាយព័ត៌មានឯកជន និងការចាក់បញ្ចូលរហ័សតាមរយៈការគ្រប់គ្រង និងការធ្វើតេស្ត។

តើ​គំរូ​គ្រឹះ​នៅ​ក្នុង​បច្ចេកវិទ្យា​បញ្ញា​សិប្បនិម្មិត​បង្កើត​ឡើង​ដោយ​ស្វ័យប្រវត្តិ​មាន​អ្វីខ្លះ? ព័ត៌មាន​ក្រាហ្វិក

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 តើក្រុមហ៊ុន AI ជាអ្វី?
ស្វែងយល់ពីរបៀបដែលក្រុមហ៊ុន AI បង្កើតផលិតផល ក្រុមការងារ និងគំរូប្រាក់ចំណូល។.

🔗 តើកូដ AI មើលទៅដូចអ្វី
សូមមើលឧទាហរណ៍នៃកូដ AI ចាប់ពីម៉ូដែល Python រហូតដល់ APIs។.

🔗 តើ​ក្បួនដោះស្រាយ AI ជាអ្វី?
ស្វែងយល់ពីអ្វីដែលជាក្បួនដោះស្រាយ AI និងរបៀបដែលពួកវាធ្វើការសម្រេចចិត្ត។.

🔗 តើបច្ចេកវិទ្យា AI ជាអ្វី?
ស្វែងយល់ពីបច្ចេកវិទ្យា AI ស្នូលដែលជំរុញស្វ័យប្រវត្តិកម្ម ការវិភាគ និងកម្មវិធីឆ្លាតវៃ។.


១) គំរូគ្រឹះ - និយមន័យគ្មានអ័ព្ទ 🧠

គំរូ គ្រឹះ គឺជាគំរូ AI ធំមួយសម្រាប់គោលបំណងទូទៅ ដែលត្រូវបានបណ្តុះបណ្តាលលើទិន្នន័យទូលំទូលាយ (ជាធម្មតាមានចំនួនច្រើន) ដូច្នេះវាអាចត្រូវបានសម្របទៅនឹងកិច្ចការជាច្រើន មិនមែនគ្រាន់តែមួយទេ ( NIST , Stanford CRFM )។

ជំនួស​ឲ្យ​ការ​បង្កើត​គំរូ​ដាច់​ដោយ​ឡែក​សម្រាប់៖

  • ការសរសេរអ៊ីមែល

  • ការឆ្លើយសំណួរ

  • ការសង្ខេបឯកសារ PDF

  • បង្កើតរូបភាព

  • ការចាត់ថ្នាក់សំបុត្រគាំទ្រ

  • ការបកប្រែភាសា

  • ការធ្វើការណែនាំអំពីកូដ

...អ្នកបណ្តុះបណ្តាលគំរូមូលដ្ឋានធំមួយដែល «រៀនពិភពលោក» តាមរបៀបស្ថិតិមិនច្បាស់លាស់ បន្ទាប់មកអ្នក សម្រប វាទៅនឹងការងារជាក់លាក់ជាមួយនឹងការជំរុញ ការលៃតម្រូវល្អិតល្អន់ ឬឧបករណ៍បន្ថែម ( Bommasani et al., 2021 )។

ម្យ៉ាង​ទៀត​វា​ជា ​ម៉ាស៊ីន​ទូទៅ ​ដែល​អ្នក​អាច​បើកបរ​បាន។

ហើយមែនហើយ ពាក្យគន្លឹះគឺ "ទូទៅ"។ នោះជាល្បិចទាំងមូល។.


២) តើ​គំរូ​គ្រឹះ​ក្នុង​បច្ចេកវិទ្យា​បង្កើត​ឡើង​ដោយ​ស្វ័យប្រវត្តិ​មាន​អ្វីខ្លះ? (តើ​វា​សម​នឹង​ចំណុច​ណា​ជាពិសេស) 🎨📝

ដូច្នេះ តើ​គំរូ​មូលដ្ឋាន​នៅ​ក្នុង​ Generative AI មាន​អ្វី​ខ្លះ? ពួក​វា​ជា​គំរូ​មូលដ្ឋាន​ដែល​ផ្តល់​ថាមពល​ដល់​ប្រព័ន្ធ​ដែល​អាច ​បង្កើត ​ខ្លឹមសារ​ថ្មី - អត្ថបទ រូបភាព អូឌីយ៉ូ កូដ វីដេអូ និង​ល្បាយ​កាន់តែ​ច្រើន​ឡើងៗ​នៃ​ទាំងអស់​នោះ ( NIST , NIST Generative AI Profile )។

បញ្ញាសិប្បនិម្មិត (AI) មិនមែនគ្រាន់តែអំពីការទស្សន៍ទាយស្លាកដូចជា "សារឥតបានការ / មិនមែនសារឥតបានការ" នោះទេ។ វានិយាយអំពីការផលិតលទ្ធផលដែលមើលទៅដូចជាវាត្រូវបានបង្កើតឡើងដោយមនុស្សម្នាក់។.

  • កថាខណ្ឌ

  • កំណាព្យ

  • ការពិពណ៌នាអំពីផលិតផល

  • រូបភាព

  • ភ្លេង

  • គំរូដើមកម្មវិធី

  • សំឡេងសំយោគ

  • ហើយពេលខ្លះមានទំនុកចិត្តលើខ្លួនឯងដោយមិនសមហេតុផល 🙃

គំរូគ្រឹះគឺ ជាពិសេស នៅទីនេះពីព្រោះ៖

  • ពួកគេបានស្រូបយកគំរូទូលំទូលាយពីសំណុំទិន្នន័យដ៏ធំ ( Bommasani et al., 2021 )

  • ពួកគេអាចធ្វើឱ្យទូទៅទៅជាការជំរុញថ្មីៗ (សូម្បីតែការជំរុញចម្លែកៗក៏ដោយ) ( Brown et al., 2020 )

  • ពួកវាអាចត្រូវបានប្រើប្រាស់ឡើងវិញសម្រាប់លទ្ធផលរាប់សិបដោយមិនចាំបាច់បណ្តុះបណ្តាលឡើងវិញពីដំបូង ( Bommasani et al., 2021 )

ពួកវាជា «ស្រទាប់មូលដ្ឋាន» - ដូចជាម្សៅនំប៉័ង។ អ្នកអាចដុតនំវាទៅជានំប៉័ងបាហ្គេត ភីហ្សា ឬនំស៊ីណាម៉ុន… មិនមែនជាពាក្យប្រៀបធៀបដ៏ល្អឥតខ្ចោះទេ ប៉ុន្តែអ្នកយល់ហើយ 😄


៣) ហេតុអ្វីបានជាពួកគេបានផ្លាស់ប្តូរអ្វីៗគ្រប់យ៉ាង (និងហេតុអ្វីបានជាមនុស្សមិនឈប់និយាយអំពីពួកគេ) 🚀

មុនពេលមានគំរូគ្រឹះ បញ្ញាសិប្បនិម្មិតជាច្រើនគឺជាក់លាក់ចំពោះភារកិច្ច៖

  • បណ្តុះបណ្តាលគំរូសម្រាប់ការវិភាគអារម្មណ៍

  • បណ្តុះបណ្តាលអ្នកបកប្រែម្នាក់ទៀត

  • បណ្តុះបណ្តាលមួយផ្សេងទៀតសម្រាប់ការចាត់ថ្នាក់រូបភាព

  • បណ្តុះបណ្តាលមួយផ្សេងទៀតសម្រាប់ការទទួលស្គាល់អង្គភាពដែលមានឈ្មោះ

វាដំណើរការបាន ប៉ុន្តែវាយឺត ថ្លៃ និងផុយស្រួយបន្តិច។.

គំរូមូលនិធិបានបង្វែរវា៖

  • ហ្វឹកហាត់ជាមុនម្តង (ការខិតខំប្រឹងប្រែងយ៉ាងខ្លាំង)

  • ប្រើឡើងវិញនៅគ្រប់ទីកន្លែង (ការសងធំ) ( Bommasani et al., 2021 )

ការប្រើប្រាស់ឡើងវិញនោះគឺជាការគុណ។ ក្រុមហ៊ុននានាអាចបង្កើតលក្ខណៈពិសេសចំនួន 20 នៅលើកំពូលនៃគ្រួសារម៉ូដែលមួយ ជាជាងការបង្កើតកង់ឡើងវិញចំនួន 20 ដង។.

ជាងនេះទៅទៀត បទពិសោធន៍អ្នកប្រើប្រាស់ក៏កាន់តែមានលក្ខណៈធម្មជាតិផងដែរ៖

  • អ្នកមិន "ប្រើឧបករណ៍ចាត់ថ្នាក់" ទេ

  • អ្នកនិយាយជាមួយតារាម៉ូដែលដូចជាមិត្តរួមការងារដែលជួយយើងយ៉ាងមានប្រយោជន៍ ដែលមិនដែលដេកលក់ ☕🤝

ពេលខ្លះវាក៏ដូចជាមិត្តរួមការងារម្នាក់ដែលយល់ច្រឡំគ្រប់យ៉ាងដោយទំនុកចិត្ត ប៉ុន្តែអ្ហា៎! ការរីកចម្រើន។.


៤) គំនិតស្នូល៖ ការហ្វឹកហ្វឺនជាមុន + ការសម្របខ្លួន 🧩

គំរូគ្រឹះស្ទើរតែទាំងអស់ធ្វើតាមគំរូមួយ ( Stanford CRFM , NIST ):

ការបណ្តុះបណ្តាលជាមុន (ដំណាក់កាល "ស្រូបយកអ៊ីនធឺណិត") 📚

គំរូនេះត្រូវបានបណ្តុះបណ្តាលលើសំណុំទិន្នន័យដ៏ធំ និងទូលំទូលាយដោយប្រើប្រាស់ការរៀនសូត្រដោយខ្លួនឯង ( NIST )។ ចំពោះគំរូភាសា ជាធម្មតាមានន័យថាការទស្សន៍ទាយពាក្យដែលបាត់ ឬសញ្ញាសម្គាល់បន្ទាប់ ( Devlin et al., 2018 , Brown et al., 2020 )។

ចំណុចសំខាន់មិនមែនបង្រៀនវានូវកិច្ចការតែមួយនោះទេ។ ចំណុចសំខាន់គឺបង្រៀនវា អំពីការតំណាងទូទៅ

  • វេយ្យាករណ៍

  • ការពិត (ប្រភេទ)

  • គំរូនៃការវែកញែក (ពេលខ្លះ)

  • រចនាប័ទ្មសរសេរ

  • រចនាសម្ព័ន្ធកូដ

  • ចេតនារបស់មនុស្សទូទៅ

ការសម្របខ្លួន (ដំណាក់កាល "ធ្វើឱ្យវាជាក់ស្តែង") 🛠️

បន្ទាប់មកអ្នកសម្របវាដោយប្រើមួយ ឬច្រើននៃ៖

  • ការជំរុញ (ការណែនាំជាភាសាសាមញ្ញ)

  • ការលៃតម្រូវការណែនាំ (ហ្វឹកហាត់វាឱ្យធ្វើតាមការណែនាំ) ( Wei et al., 2021 )

  • ការលៃតម្រូវដ៏ល្អិតល្អន់ (ការបណ្តុះបណ្តាលលើទិន្នន័យដូមេនរបស់អ្នក)

  • LoRA / អាដាប់ទ័រ (វិធីសាស្ត្រលៃតម្រូវទម្ងន់ស្រាល) ( Hu et al., 2021 )

  • RAG (ជំនាន់ទាញយកបន្ថែម - គំរូពិគ្រោះជាមួយឯកសាររបស់អ្នក) ( Lewis et al., 2020 )

  • ការប្រើប្រាស់ឧបករណ៍ (មុខងារហៅទូរសព្ទ ការរុករកប្រព័ន្ធខាងក្នុង។ល។)

នេះជាមូលហេតុដែលគំរូមូលដ្ឋានដូចគ្នាអាចសរសេរឈុតឆាកស្នេហា... បន្ទាប់មកជួយបំបាត់កំហុសសំណួរ SQL ប្រាំវិនាទីក្រោយមក 😭


៥) តើ​អ្វី​ទៅ​ដែល​ធ្វើ​ឱ្យ​គំរូ​គ្រឹះ​មួយ​មាន​លក្ខណៈ​ល្អ? ✅

នេះ​ជា​ផ្នែក​ដែល​មនុស្ស​រំលង ហើយ​បន្ទាប់​មក​ស្ដាយ​ក្រោយ។.

គំរូគ្រឹះ «ល្អ» មិនមែនគ្រាន់តែ «ធំជាង» នោះទេ។ ធំជាងជួយបាន ពិតណាស់… ប៉ុន្តែវាមិនមែនជារឿងតែមួយគត់នោះទេ។ គំរូគ្រឹះដ៏ល្អជាធម្មតាមាន៖

ការធ្វើឱ្យមានលក្ខណៈទូទៅខ្លាំង 🧠

វាដំណើរការបានល្អលើភារកិច្ចជាច្រើនដោយមិនចាំបាច់មានការបណ្តុះបណ្តាលឡើងវិញជាក់លាក់តាមភារកិច្ចនោះទេ ( Bommasani et al., 2021 )។

ការបើកបរ និង ការគ្រប់គ្រង 🎛️

វាអាចអនុវត្តតាមការណែនាំដូចជា៖

  • «ត្រូវ​សង្ខេប»

  • «ប្រើចំណុចសំខាន់ៗ»

  • «សរសេរដោយសំឡេងរួសរាយរាក់ទាក់»

  • «កុំបង្ហាញព័ត៌មានសម្ងាត់»

ម៉ូដែលខ្លះឆ្លាតណាស់តែរអិល។ ដូចជាការព្យាយាមកាន់សាប៊ូមួយដុំក្នុងបន្ទប់ទឹកអញ្ចឹង។ មានប្រយោជន៍ ប៉ុន្តែមិនទៀងទាត់ 😅

ទំនោរនៃការយល់ច្រឡំទាប (ឬយ៉ាងហោចណាស់ភាពមិនប្រាកដប្រជាដោយស្មោះត្រង់) 🧯

គ្មានគំរូណាដែលមានភាពស៊ាំនឹងការយល់ច្រឡំនោះទេ ប៉ុន្តែគំរូល្អៗ៖

  • យល់ច្រឡំតិចជាង

  • ទទួលស្គាល់ភាពមិនប្រាកដប្រជាញឹកញាប់ជាងមុន

  • រក្សា​ភាព​ជិត​ស្និទ្ធ​នឹង​បរិបទ​ដែល​បាន​ផ្ដល់​ឲ្យ​នៅពេល​ប្រើ​ការ​ទាញ​យក ( Ji et al., 2023 , Lewis et al., 2020 )

សមត្ថភាពពហុម៉ូឌុលល្អ (នៅពេលចាំបាច់) 🖼️🎧

ប្រសិនបើអ្នកកំពុងសាងសង់ជំនួយការដែលអានរូបភាព បកស្រាយតារាង ឬយល់សំឡេង ពហុម៉ូឌុលមានសារៈសំខាន់ខ្លាំងណាស់ ( Radford et al., 2021 )។

ការសន្និដ្ឋានប្រកបដោយប្រសិទ្ធភាព ⚡

ភាពយឺតយ៉ាវ និងតម្លៃគឺជារឿងសំខាន់។ ម៉ូដែលដែលខ្លាំង ប៉ុន្តែយឺត គឺដូចជារថយន្តស្ព័រដែលមានសំបកកង់បែក។.

ឥរិយាបថសុវត្ថិភាព និងការសម្របសម្រួល 🧩

មិនត្រឹមតែ «បដិសេធអ្វីៗទាំងអស់» ប៉ុណ្ណោះទេ ប៉ុន្តែ៖

  • ជៀសវាងការណែនាំដែលបង្កគ្រោះថ្នាក់

  • កាត់បន្ថយភាពលំអៀង

  • ដោះស្រាយប្រធានបទរសើបដោយប្រុងប្រយ័ត្ន

  • ទប់ទល់នឹងការប៉ុនប៉ង jailbreak ជាមូលដ្ឋាន (ខ្លះ…) ( NIST AI RMF 1.0 , NIST Generative AI Profile )

ឯកសារ + ប្រព័ន្ធអេកូឡូស៊ី 🌱

នេះស្តាប់ទៅដូចជាស្ងួតបន្តិច ប៉ុន្តែវាជាការពិត៖

  • ឧបករណ៍

  • ខ្សែក្រវាត់ eval

  • ជម្រើសដាក់ពង្រាយ

  • ការគ្រប់គ្រងសហគ្រាស

  • ការគាំទ្រការលៃតម្រូវល្អិតល្អន់

មែនហើយ «ប្រព័ន្ធអេកូឡូស៊ី» គឺជាពាក្យមិនច្បាស់លាស់មួយ។ ខ្ញុំក៏ស្អប់វាដែរ។ ប៉ុន្តែវាសំខាន់ណាស់។.


៦) តារាងប្រៀបធៀប - ជម្រើសគំរូគ្រឹះទូទៅ (និងអ្វីដែលវាល្អសម្រាប់) 🧾

ខាងក្រោមនេះគឺជាតារាងប្រៀបធៀបជាក់ស្តែង ដែលមិនល្អឥតខ្ចោះបន្តិច។ វាមិនមែនជា "បញ្ជីពិតតែមួយ" ទេ វាដូចជាអ្វីដែលមនុស្សជ្រើសរើសនៅក្នុងព្រៃ។.

ប្រភេទឧបករណ៍/ម៉ូដែល ទស្សនិកជន ថ្លៃដូច ហេតុអ្វីបានជាវាដំណើរការ
LLM ផ្ទាល់ខ្លួន (រចនាប័ទ្មជជែក) ក្រុមដែលចង់បានល្បឿន + ការកែលម្អ ផ្អែកលើការប្រើប្រាស់ / ការជាវ ការអនុវត្តតាមការណែនាំដ៏ល្អ ការអនុវត្តទូទៅដ៏រឹងមាំ ជាធម្មតាល្អបំផុត "ក្រៅប្រអប់" 😌
LLM ទម្ងន់បើកចំហ (អាចធ្វើជាម្ចាស់ផ្ទះដោយខ្លួនឯងបាន) អ្នកសាងសង់ដែលចង់គ្រប់គ្រង ថ្លៃដើមហេដ្ឋារចនាសម្ព័ន្ធ (និងបញ្ហាឈឺក្បាល) អាចប្ដូរតាមបំណងបាន ងាយស្រួលសម្រាប់ភាពឯកជន អាចដំណើរការក្នុងមូលដ្ឋាន… ប្រសិនបើអ្នកចូលចិត្តលេងសើចនៅពាក់កណ្តាលអធ្រាត្រ
ម៉ាស៊ីនបង្កើតរូបភាពសាយភាយ ក្រុមច្នៃប្រឌិត, ក្រុមរចនា ពីឥតគិតថ្លៃទៅបង់ប្រាក់ ការសំយោគរូបភាពដ៏ល្អឥតខ្ចោះ ភាពចម្រុះនៃរចនាប័ទ្ម លំហូរការងារម្តងហើយម្តងទៀត (ក៏៖ ម្រាមដៃអាចនឹងមានបញ្ហា) ✋😬 ( Ho et al., 2020 , Rombach et al., 2021 )
គំរូ "ចក្ខុវិស័យ-ភាសា" ពហុម៉ូឌុល កម្មវិធីដែលអានរូបភាព + អត្ថបទ ផ្អែកលើការប្រើប្រាស់ អនុញ្ញាតឱ្យអ្នកសួរសំណួរអំពីរូបភាព រូបថតអេក្រង់ ដ្យាក្រាម - មានប្រយោជន៍គួរឱ្យភ្ញាក់ផ្អើល ( Radford et al., 2021 )
គំរូគ្រឹះដែលបង្កប់ ប្រព័ន្ធស្វែងរក + RAG តម្លៃទាបក្នុងមួយការហៅ ប្រែក្លាយអត្ថបទទៅជាវ៉ិចទ័រសម្រាប់ការស្វែងរកន័យវិទ្យា ការដាក់ជាក្រុម ការណែនាំ - ថាមពល MVP ស្ងាត់ៗ ( Karpukhin et al., 2020 , Douze et al., 2024 )
គំរូមូលដ្ឋាននៃការនិយាយទៅជាអត្ថបទ មជ្ឈមណ្ឌលហៅទូរសព្ទ, អ្នកបង្កើត ផ្អែកលើការប្រើប្រាស់ / ក្នុងស្រុក ការចម្លងអត្ថបទលឿន ការគាំទ្រច្រើនភាសា ល្អគ្រប់គ្រាន់សម្រាប់សំឡេងរំខាន (ជាធម្មតា) 🎙️ ( ខ្សឹប )
គំរូមូលដ្ឋានអត្ថបទទៅជាការនិយាយ ក្រុមផលិតផល, ប្រព័ន្ធផ្សព្វផ្សាយ ផ្អែកលើការប្រើប្រាស់ ការបង្កើតសំឡេងធម្មជាតិ រចនាប័ទ្មសំឡេង ការនិទានរឿង - អាចក្លាយជារឿងគួរឱ្យខ្លាច-ពិត ( Shen et al., 2017 )
LLM ដែលផ្តោតលើកូដ អ្នកអភិវឌ្ឍន៍ ផ្អែកលើការប្រើប្រាស់ / ការជាវ ពូកែខាងកូដ កែកំហុស កែសម្រួលឡើងវិញ… នៅតែមិនមែនជាអ្នកអានគំនិតទេ 😅

សូមកត់សម្គាល់ថា "គំរូគ្រឹះ" មិនត្រឹមតែមានន័យថា "chatbot" នោះទេ។ ការបង្កប់ និងគំរូសុន្ទរកថាក៏អាចជាមូលដ្ឋានផងដែរ ពីព្រោះពួកវាមានលក្ខណៈទូលំទូលាយ និងអាចប្រើឡើងវិញបាននៅទូទាំងកិច្ចការនានា ( Bommasani et al., 2021 , NIST )។


៧) ក្រឡេកមើលឱ្យកាន់តែជិត៖ របៀបដែលគំរូគ្រឹះភាសារៀន (កំណែ vibe) 🧠🧃

គំរូគ្រឹះភាសា (ជារឿយៗត្រូវបានគេហៅថា LLMs) ជាធម្មតាត្រូវបានបណ្តុះបណ្តាលលើការប្រមូលអត្ថបទយ៉ាងច្រើន។ ពួកគេរៀនដោយការទស្សន៍ទាយសញ្ញាសម្ងាត់ ( Brown et al., 2020 )។ ប៉ុណ្ណឹងហើយ។ គ្មានធូលីទេពអប្សរសម្ងាត់ទេ។

ប៉ុន្តែ​មន្តអាគម​គឺថា ការទស្សន៍ទាយ​ថូខឹន​បង្ខំ​ឱ្យ​គំរូ​រៀន​រចនាសម្ព័ន្ធ ( CSET )៖

  • វេយ្យាករណ៍ និង វាក្យសម្ព័ន្ធ

  • ទំនាក់ទំនងប្រធានបទ

  • គំរូដូចជាការវែកញែក (ពេលខ្លះ)

  • លំដាប់ទូទៅនៃការគិត

  • របៀបដែលមនុស្សពន្យល់រឿងต่างๆ ឈ្លោះប្រកែកគ្នា សុំទោស ចរចា បង្រៀន

វាដូចជាការរៀនធ្វើត្រាប់តាមការសន្ទនារាប់លានដោយមិន "យល់" ពីរបៀបដែលមនុស្សធ្វើ។ ដែលស្តាប់ទៅដូចជាវាមិនគួរដំណើរការទេ... ប៉ុន្តែវានៅតែបន្តដំណើរការ។.

ការនិយាយបំផ្លើសបន្តិចបន្តួច៖ វាដូចជាការបង្ហាប់ការសរសេររបស់មនុស្សទៅក្នុងខួរក្បាលប្រូបាប៊ីលីតេដ៏ធំមួយ។
ម្យ៉ាងវិញទៀត ពាក្យប្រៀបធៀបនោះហាក់ដូចជាត្រូវបណ្តាសាបន្តិច។ ប៉ុន្តែយើងផ្លាស់ប្តូរ 😄


៨) ក្រឡេកមើលឱ្យកាន់តែជិត៖ គំរូសាយភាយ (ហេតុអ្វីបានជារូបភាពដំណើរការខុសគ្នា) 🎨🌀

គំរូ​គ្រឹះ​រូបភាព​ច្រើន​តែ​ប្រើ ​វិធីសាស្ត្រ ​សាយភាយ Ho et al., 2020 , Rombach et al., 2021 )។

គំនិតដ៏លំបាក៖

  1. បន្ថែមសំឡេងរំខានទៅរូបភាពរហូតដល់ពួកវាជាមូលដ្ឋានទូរទស្សន៍ឋិតិវន្ត

  2. បង្វឹកគំរូមួយដើម្បីបញ្ច្រាសសំឡេងរំខាននោះមួយជំហានម្តងៗ

  3. នៅពេលបង្កើត សូមចាប់ផ្តើមជាមួយនឹងសំឡេងរំខាន ហើយ "បន្ថយសំឡេងរំខាន" ទៅជារូបភាពដែលដឹកនាំដោយការណែនាំ ( Ho et al., 2020 )

នេះជាមូលហេតុដែលការបង្កើតរូបភាពមានអារម្មណ៍ដូចជា "ការអភិវឌ្ឍ" រូបថតមួយសន្លឹក លើកលែងតែរូបថតនោះគឺជានាគពាក់ស្បែកជើងប៉ាតានៅក្នុងច្រកផ្សារទំនើប 🛒🐉

ម៉ូដែលសាយភាយគឺល្អពីព្រោះ៖

  • ពួកគេបង្កើតរូបភាពដែលមានគុណភាពខ្ពស់

  • ពួកគេអាចត្រូវបានដឹកនាំយ៉ាងខ្លាំងដោយអត្ថបទ

  • ពួកគេគាំទ្រការកែលម្អម្តងហើយម្តងទៀត (បំរែបំរួល ការលាបពណ៌ ការបង្កើនទំហំ) ( Rombach et al., 2021 )

ពេលខ្លះពួកគេក៏តស៊ូជាមួយ៖

  • ការបង្ហាញអត្ថបទនៅខាងក្នុងរូបភាព

  • ព័ត៌មានលម្អិតកាយវិភាគសាស្ត្រល្អិតល្អន់

  • អត្តសញ្ញាណតួអង្គដែលស៊ីសង្វាក់គ្នានៅទូទាំងឈុតឆាក (វាកំពុងប្រសើរឡើង ប៉ុន្តែនៅតែមាន)


៩) ក្រឡេកមើលឲ្យកាន់តែជិត៖ គំរូគ្រឹះពហុម៉ូឌុល (អត្ថបទ + រូបភាព + សំឡេង) 👀🎧📝

គំរូគ្រឹះពហុម៉ូឌុលមានគោលបំណងយល់ និងបង្កើតទិន្នន័យឆ្លងកាត់ប្រភេទទិន្នន័យច្រើនប្រភេទ៖

ហេតុអ្វីបានជារឿងនេះសំខាន់ក្នុងជីវិតពិត៖

  • ការគាំទ្រអតិថិជនអាចបកស្រាយរូបថតអេក្រង់

  • ឧបករណ៍​ភាពងាយស្រួល​អាច​ពណ៌នា​អំពី​រូបភាព

  • កម្មវិធីអប់រំអាចពន្យល់ដ្យាក្រាម

  • អ្នកបង្កើតអាចកែច្នៃទម្រង់ឡើងវិញបានយ៉ាងឆាប់រហ័ស

  • ឧបករណ៍អាជីវកម្មអាច "អាន" រូបថតអេក្រង់ផ្ទាំងគ្រប់គ្រង ហើយសង្ខេបវា

នៅក្រោមគម្រប ប្រព័ន្ធពហុម៉ូឌុលច្រើនតែតម្រឹមការតំណាង៖

  • បង្វែររូបភាពទៅជាការបង្កប់

  • បំលែងអត្ថបទទៅជាការបង្កប់

  • រៀន​កន្លែង​ចែករំលែក​មួយ​ដែល​ពាក្យ “ឆ្មា” ផ្គូផ្គង​នឹង​ភីកសែល​ឆ្មា 😺 ( Radford et al., 2021 )

វាមិនតែងតែឆើតឆាយនោះទេ។ ពេលខ្លះវាត្រូវបានដេរភ្ជាប់គ្នាដូចជាភួយ។ ប៉ុន្តែវាដំណើរការ។.


១០) ការលៃតម្រូវល្អិតល្អន់ ទល់នឹង ការជំរុញ ទល់នឹង RAG (របៀបដែលអ្នកសម្របគំរូមូលដ្ឋាន) 🧰

ប្រសិនបើអ្នកកំពុងព្យាយាមធ្វើឱ្យគំរូគ្រឹះមួយអាចអនុវត្តបានសម្រាប់វិស័យជាក់លាក់មួយ (ផ្នែកច្បាប់ វេជ្ជសាស្ត្រ សេវាកម្មអតិថិជន ចំណេះដឹងផ្ទៃក្នុង) អ្នកមានចំណុចសំខាន់ៗមួយចំនួន៖

ជំរុញចិត្ត🗣️

លឿនបំផុត និងសាមញ្ញបំផុត។.

  • គុណសម្បត្តិ៖ មិនចាំបាច់ហ្វឹកហាត់ ការធ្វើម្តងទៀតភ្លាមៗ

  • គុណវិបត្តិ៖ អាចមិនស៊ីសង្វាក់គ្នា ដែនកំណត់បរិបទ ភាពផុយស្រួយភ្លាមៗ

ការលៃតម្រូវយ៉ាងល្អិតល្អន់ 🎯

បណ្តុះបណ្តាលគំរូបន្ថែមទៀតលើឧទាហរណ៍របស់អ្នក។.

  • គុណសម្បត្តិ៖ ឥរិយាបថកាន់តែស៊ីសង្វាក់គ្នា ភាសាដែនកាន់តែប្រសើរ អាចកាត់បន្ថយប្រវែងនៃប្រអប់បញ្ចូល

  • គុណវិបត្តិ៖ តម្លៃ តម្រូវការគុណភាពទិន្នន័យ ហានិភ័យនៃការបំពេញលើសកម្រិត ការថែទាំ

ការលៃតម្រូវទម្ងន់ស្រាល (LoRA / អាដាប់ទ័រ) 🧩

កំណែ​ដែល​មាន​ប្រសិទ្ធភាព​ជាង​មុន​នៃ​ការ​លៃ​តម្រូវ​ល្អិតល្អន់ ( Hu et al., 2021 )។

  • គុណសម្បត្តិ៖ ថោកជាង, ម៉ូឌុល, ងាយស្រួលប្តូរ

  • គុណវិបត្តិ៖ នៅតែត្រូវការការបណ្តុះបណ្តាល និងការវាយតម្លៃ

RAG (ជំនាន់ទាញយកបន្ថែម) 🔎

គំរូនេះទាញយកឯកសារពាក់ព័ន្ធពីមូលដ្ឋានចំណេះដឹងរបស់អ្នក និងចម្លើយដោយប្រើប្រាស់ពួកវា ( Lewis et al., 2020 )។

  • គុណសម្បត្តិ៖ ចំណេះដឹងថ្មីៗ ការដកស្រង់សម្តីពីខាងក្នុង (ប្រសិនបើអ្នកអនុវត្តវា) ការបណ្តុះបណ្តាលឡើងវិញតិចជាងមុន។

  • គុណវិបត្តិ៖ គុណភាពនៃការទាញយកអាចធ្វើឱ្យវាជោគជ័យ ឬបរាជ័យ ត្រូវការការបំបែកល្អ + ការបង្កប់

ការនិយាយពិត៖ ប្រព័ន្ធជោគជ័យជាច្រើនរួមបញ្ចូលគ្នានូវការជំរុញ + RAG។ ការលៃតម្រូវល្អិតល្អន់គឺមានឥទ្ធិពលខ្លាំង ប៉ុន្តែមិនចាំបាច់ជានិច្ចនោះទេ។ មនុស្សលោតទៅរកវាលឿនពេកព្រោះវាស្តាប់ទៅគួរឱ្យចាប់អារម្មណ៍ 😅


១១) ហានិភ័យ ដែនកំណត់ និងផ្នែក “សូមកុំដាក់ពង្រាយរឿងនេះដោយងងឹតងងល់” 🧯😬

គំរូគ្រឹះមានឥទ្ធិពលខ្លាំង ប៉ុន្តែវាមិនស្ថិតស្ថេរដូចកម្មវិធីប្រពៃណីទេ។ ពួកវាដូចជា… អ្នកហាត់ការដ៏មានទេពកោសល្យដែលមានបញ្ហាទំនុកចិត្ត។.

ដែនកំណត់សំខាន់ៗសម្រាប់ផែនការ៖

ការយល់ច្រឡំ 🌀

ម៉ូដែលអាចបង្កើត៖

  • ប្រភពក្លែងក្លាយ

  • ការពិតមិនត្រឹមត្រូវ

  • ជំហាន​ដែល​អាច​ជឿ​ទុកចិត្ត​បាន ប៉ុន្តែ​ខុស ( Ji et al., 2023 )

ការកាត់បន្ថយ៖

  • RAG ជាមួយបរិបទដែលមានមូលដ្ឋាន ( Lewis et al., 2020 )

  • លទ្ធផលដែលមានកម្រិត (គ្រោងការណ៍ ការហៅឧបករណ៍)

  • ការណែនាំច្បាស់លាស់ "កុំទាយ"

  • ស្រទាប់ផ្ទៀងផ្ទាត់ (ច្បាប់ ការត្រួតពិនិត្យឆ្លងកាត់ ការពិនិត្យឡើងវិញដោយមនុស្ស)

ភាពលំអៀង និងលំនាំដែលបង្កគ្រោះថ្នាក់ ⚠️

ដោយសារតែទិន្នន័យបណ្តុះបណ្តាលឆ្លុះបញ្ចាំងពីមនុស្ស អ្នកអាចទទួលបាន៖

  • គំរូ​និយម

  • ការអនុវត្តមិនស្មើគ្នានៅទូទាំងក្រុម

  • ការបញ្ចប់ដែលមិនមានសុវត្ថិភាព ( NIST AI RMF 1.0 , Bommasani et al ។ , 2021 )

ការកាត់បន្ថយ៖

  • ការលៃតម្រូវសុវត្ថិភាព

  • ក្រុមក្រហម

  • តម្រងមាតិកា

  • ការរឹតបន្តឹងដូមេនដោយប្រុងប្រយ័ត្ន ( ទម្រង់ AI ជំនាន់ NIST )

ភាពឯកជន និងការលេចធ្លាយទិន្នន័យ 🔒

ប្រសិនបើអ្នកបញ្ចូលទិន្នន័យសម្ងាត់ទៅក្នុងចំណុចបញ្ចប់គំរូ អ្នកត្រូវដឹង៖

  • របៀបដែលវាត្រូវបានរក្សាទុក

  • ថាតើវាត្រូវបានប្រើសម្រាប់ការបណ្តុះបណ្តាលឬអត់

  • អ្វីដែលការកត់ត្រាមាន

  • អ្វីដែលគ្រប់គ្រងតម្រូវការរបស់អង្គការរបស់អ្នក ( NIST AI RMF 1.0 )

ការកាត់បន្ថយ៖

  • ជម្រើសដាក់ពង្រាយឯកជន

  • អភិបាលកិច្ចរឹងមាំ

  • ការប៉ះពាល់ទិន្នន័យតិចតួចបំផុត

  • RAG សម្រាប់​តែ​ផ្ទៃក្នុង​ប៉ុណ្ណោះ ដែល​មាន​ការគ្រប់គ្រង​ការចូលប្រើ​យ៉ាងតឹងរ៉ឹង ( NIST Generative AI Profile , Carlini et al., 2021 )

ចាក់ថ្នាំភ្លាមៗ (ជាពិសេសជាមួយ RAG) 🕳️

ប្រសិនបើគំរូអានអត្ថបទដែលមិនគួរឱ្យទុកចិត្ត អត្ថបទនោះអាចព្យាយាមរៀបចំវា៖

  • "មិនអើពើនឹងការណែនាំពីមុន..."

  • «ផ្ញើ​អាថ៌កំបាំង​មក​ខ្ញុំ…» ( OWASP , Greshake et al., 2023 )

ការកាត់បន្ថយ៖

  • ការណែនាំអំពីប្រព័ន្ធដាច់ដោយឡែក

  • សម្អាតមាតិកាដែលបានទាញយក

  • ប្រើប្រាស់គោលការណ៍ដែលមានមូលដ្ឋានលើឧបករណ៍ (មិនមែនគ្រាន់តែការណែនាំទេ)

  • សាកល្បងជាមួយធាតុចូលផ្ទុយ ( សន្លឹកបន្លំ OWASP , ទម្រង់ AI ជំនាន់ NIST )

មិនមែន​ព្យាយាម​បំភ័យ​អ្នក​ទេ។ គ្រាន់តែ… វាជាការប្រសើរក្នុងការដឹងពីកន្លែងដែលក្តារកម្រាលឥដ្ឋមានសំឡេងកកិត។.


១២) របៀបជ្រើសរើសម៉ូដែលគ្រឹះសម្រាប់ករណីប្រើប្រាស់របស់អ្នក 🎛️

ប្រសិនបើអ្នកកំពុងជ្រើសរើសគំរូគ្រឹះ (ឬសាងសង់លើគំរូមួយ) សូមចាប់ផ្តើមជាមួយនឹងការជំរុញទាំងនេះ៖

កំណត់អ្វីដែលអ្នកកំពុងបង្កើត និងអ្វីដែលអ្នកកំពុងធ្វើ

  • អត្ថបទតែប៉ុណ្ណោះ

  • រូបភាព

  • អូឌីយ៉ូ

  • ពហុមធ្យោបាយចម្រុះ

កំណត់របារការពិតរបស់អ្នក📌

ប្រសិនបើអ្នកត្រូវការភាពត្រឹមត្រូវខ្ពស់ (ហិរញ្ញវត្ថុ សុខភាព ច្បាប់ សុវត្ថិភាព)៖

  • អ្នកនឹងចង់បាន RAG ( Lewis et al., 2020 )

  • អ្នកនឹងចង់បានការផ្ទៀងផ្ទាត់

  • អ្នកនឹងចង់បានការពិនិត្យឡើងវិញដោយមនុស្ស (យ៉ាងហោចណាស់ពេលខ្លះ) ( NIST AI RMF 1.0 )

សម្រេចចិត្តលើគោលដៅភាពយឺតយ៉ាវរបស់អ្នក ⚡

ការជជែកអាចធ្វើឡើងភ្លាមៗ។ ការសង្ខេបជាបាច់អាចយឺតជាង។
ប្រសិនបើអ្នកត្រូវការការឆ្លើយតបភ្លាមៗ ទំហំម៉ូដែល និងការបង្ហោះគឺជារឿងសំខាន់។

តម្រូវការឯកជនភាព និងការអនុលោមតាមផែនទី 🔐

ក្រុមខ្លះត្រូវការ៖

  • ការដាក់ពង្រាយនៅនឹងកន្លែង / VPC

  • គ្មានការរក្សាទុកទិន្នន័យ

  • កំណត់ហេតុត្រួតពិនិត្យយ៉ាងតឹងរ៉ឹង

  • ការគ្រប់គ្រងការចូលប្រើក្នុងមួយឯកសារ ( NIST AI RMF 1.0 , NIST Generative AI Profile )

ធ្វើឱ្យមានតុល្យភាពថវិកា - និងការអត់ធ្មត់ប្រតិបត្តិការ 😅

ការបង្ហោះដោយខ្លួនឯងផ្តល់នូវការគ្រប់គ្រង ប៉ុន្តែបន្ថែមភាពស្មុគស្មាញ។
API ដែលត្រូវបានគ្រប់គ្រងគឺងាយស្រួល ប៉ុន្តែអាចមានតម្លៃថ្លៃ និងមិនសូវអាចប្ដូរតាមបំណងបាន។

គន្លឹះជាក់ស្តែងតូចមួយ៖ គំរូដើមជាមួយនឹងអ្វីដែលងាយស្រួលជាមុនសិន បន្ទាប់មកធ្វើឱ្យរឹងនៅពេលក្រោយ។ ការចាប់ផ្តើមជាមួយនឹងការរៀបចំ "ល្អឥតខ្ចោះ" ជាធម្មតាធ្វើឱ្យអ្វីៗដំណើរការយឺត។.


១៣) តើ​គំរូ​គ្រឹះ​ក្នុង​បញ្ញា​សិប្បនិម្មិត​បង្កើត​ឡើង​មាន​អ្វី​ខ្លះ? (គំរូ​ផ្លូវចិត្ត​រហ័ស) 🧠✨

ចូរយើងយកវាមកវិញ។ តើគំរូគ្រឹះនៅក្នុង Generative AI ជាអ្វី?

ពួកគេគឺ៖

  • គំរូទូទៅធំៗ ដែលបានបណ្តុះបណ្តាលលើទិន្នន័យទូលំទូលាយ ( NIST , Stanford CRFM )

  • មានសមត្ថភាពបង្កើតខ្លឹមសារ (អត្ថបទ រូបភាព សំឡេង។ល។) ( ទម្រង់ AI ទូទៅរបស់ NIST )

  • អាចសម្របខ្លួនទៅនឹងកិច្ចការជាច្រើនតាមរយៈការជំរុញ ការលៃតម្រូវ និងការទាញយកមកវិញ ( Bommasani et al., 2021 )

  • ស្រទាប់មូលដ្ឋានដែលផ្តល់ថាមពលដល់ផលិតផល AI បង្កើតថ្មីទំនើបបំផុត

ពួកវាមិនមែនជាស្ថាបត្យកម្ម ឬម៉ាកយីហោតែមួយនោះទេ។ ពួកវាជាប្រភេទគំរូដែលមានឥរិយាបទដូចជាវេទិកាមួយ។.

គំរូគ្រឹះមួយមិនដូចម៉ាស៊ីនគិតលេខទេ ប៉ុន្តែដូចជាផ្ទះបាយច្រើនជាង។ អ្នកអាចចម្អិនអាហារបានច្រើននៅក្នុងនោះ។ អ្នកក៏អាចដុតនំប៉័ងអាំងបានដែរ ប្រសិនបើអ្នកមិនយកចិត្តទុកដាក់… ប៉ុន្តែផ្ទះបាយនៅតែងាយស្រួលប្រើ 🍳🔥


១៤) សង្ខេប និង​យក​ទៅ​អនុវត្ត ✅🙂

ម៉ូដែលគ្រឹះគឺជាម៉ាស៊ីនដែលអាចប្រើឡើងវិញបាននៃបញ្ញាសិប្បនិម្មិតបង្កើត។ ពួកវាត្រូវបានបណ្តុះបណ្តាលយ៉ាងទូលំទូលាយ បន្ទាប់មកសម្របខ្លួនទៅនឹងភារកិច្ចជាក់លាក់តាមរយៈការជំរុញ ការលៃតម្រូវ និងការទាញយកមកវិញ ( NIST , Stanford CRFM )។ ពួកវាអាចអស្ចារ្យ មិនស្អាត មានអានុភាព និងពេលខ្លះគួរឱ្យអស់សំណើច - ទាំងអស់ក្នុងពេលតែមួយ។

សង្ខេប៖

  • គំរូគ្រឹះ = គំរូមូលដ្ឋានសម្រាប់គោលបំណងទូទៅ ( NIST )

  • បញ្ញាសិប្បនិម្មិតបង្កើតថ្មី = ការបង្កើតខ្លឹមសារ មិនមែនគ្រាន់តែការចាត់ថ្នាក់ទេ ( ទម្រង់បញ្ញាសិប្បនិម្មិតបង្កើតថ្មី NIST )

  • វិធីសាស្ត្រ​សម្រប​ខ្លួន (ការ​ជំរុញ, RAG, ការ​លៃ​តម្រូវ) ធ្វើ​ឱ្យ​វា​អាច​អនុវត្ត​បាន​ជាក់ស្តែង ( Lewis et al., 2020 , Hu et al., 2021 )

  • ការជ្រើសរើសគំរូគឺនិយាយអំពីការសម្របសម្រួល៖ ភាពត្រឹមត្រូវ តម្លៃ ភាពយឺតយ៉ាវ ភាពឯកជន និងសុវត្ថិភាព ( NIST AI RMF 1.0 )

ប្រសិនបើអ្នកកំពុងសាងសង់អ្វីមួយដោយប្រើបច្ចេកវិទ្យា AI ដែលអាចបង្កើតបាន ការយល់ដឹងអំពីគំរូគ្រឹះមិនមែនជាជម្រើសទេ។ វាគឺជាជាន់ទាំងមូលដែលអគារនេះឈរនៅលើ... ហើយបាទ/ចាស៎ ពេលខ្លះជាន់នោះញ័របន្តិច 😅

សំណួរដែលសួរញឹកញាប់

គំរូគ្រឹះ និយាយឱ្យសាមញ្ញ

គំរូគ្រឹះគឺជាគំរូ AI ដ៏ធំមួយសម្រាប់គោលបំណងទូទៅ ដែលត្រូវបានបណ្តុះបណ្តាលលើទិន្នន័យទូលំទូលាយ ដូច្នេះវាអាចត្រូវបានប្រើឡើងវិញសម្រាប់កិច្ចការជាច្រើន។ ជំនួសឱ្យការកសាងគំរូមួយក្នុងមួយការងារ អ្នកចាប់ផ្តើមជាមួយគំរូ "មូលដ្ឋាន" ដ៏រឹងមាំមួយ ហើយសម្របវាតាមតម្រូវការ។ ការសម្របខ្លួននោះច្រើនតែកើតឡើងតាមរយៈការជំរុញ ការកែលម្អ ការទាញយកមកវិញ (RAG) ឬឧបករណ៍។ គំនិតកណ្តាលគឺភាពទូលំទូលាយបូកនឹងភាពអាចដឹកនាំបាន។.

របៀបដែលគំរូគ្រឹះខុសគ្នាពីគំរូ AI ជាក់លាក់សម្រាប់ភារកិច្ចប្រពៃណី

បញ្ញាសិប្បនិម្មិតបែបប្រពៃណីច្រើនតែបណ្តុះបណ្តាលគំរូដាច់ដោយឡែកមួយសម្រាប់កិច្ចការនីមួយៗ ដូចជាការវិភាគអារម្មណ៍ ឬការបកប្រែ។ គំរូមូលដ្ឋានបញ្ច្រាសគំរូនោះ៖ បណ្តុះបណ្តាលជាមុនម្តង បន្ទាប់មកប្រើប្រាស់ឡើងវិញនៅទូទាំងមុខងារ និងផលិតផលជាច្រើន។ នេះអាចកាត់បន្ថយការខិតខំប្រឹងប្រែងដដែលៗ និងបង្កើនល្បឿននៃការផ្តល់សមត្ថភាពថ្មីៗ។ ចំណុចវិជ្ជមានគឺថា ពួកវាអាចមិនអាចទស្សន៍ទាយបានជាងកម្មវិធីបុរាណទេ លុះត្រាតែអ្នកបន្ថែមការរឹតបន្តឹង និងការសាកល្បង។.

គំរូមូលដ្ឋាននៅក្នុង AI ដែលអាចបង្កើតបាន

នៅក្នុងបច្ចេកវិទ្យា AI ជំនាន់ថ្មី គំរូគ្រឹះគឺជាប្រព័ន្ធមូលដ្ឋានដែលអាចបង្កើតខ្លឹមសារថ្មីដូចជាអត្ថបទ រូបភាព អូឌីយ៉ូ កូដ ឬលទ្ធផលពហុម៉ូឌុល។ ពួកវាមិនត្រូវបានកំណត់ចំពោះការដាក់ស្លាក ឬការចាត់ថ្នាក់ទេ។ ពួកវាបង្កើតការឆ្លើយតបដែលស្រដៀងនឹងការងារដែលបង្កើតឡើងដោយមនុស្ស។ ដោយសារតែពួកវារៀនគំរូទូលំទូលាយក្នុងអំឡុងពេលបណ្តុះបណ្តាលជាមុន ពួកគេអាចដោះស្រាយប្រភេទ និងទម្រង់ប្រអប់បញ្ចូលជាច្រើន។ ពួកវាគឺជា "ស្រទាប់មូលដ្ឋាន" នៅពីក្រោយបទពិសោធន៍ជំនាន់ថ្មីភាគច្រើន។.

របៀបដែលគំរូគ្រឹះរៀនក្នុងអំឡុងពេលបណ្តុះបណ្តាលជាមុន

គំរូមូលដ្ឋានភាសាភាគច្រើនរៀនដោយការទស្សន៍ទាយសញ្ញាសម្គាល់ ដូចជាពាក្យបន្ទាប់ ឬពាក្យដែលបាត់នៅក្នុងអត្ថបទ។ គោលបំណងសាមញ្ញនោះជំរុញឱ្យពួកគេធ្វើសមាហរណកម្មរចនាសម្ព័ន្ធដូចជាវេយ្យាករណ៍ រចនាប័ទ្ម និងគំរូទូទៅនៃការពន្យល់។ ពួកគេក៏អាចស្រូបយកចំណេះដឹងពិភពលោកយ៉ាងច្រើនផងដែរ ទោះបីជាមិនតែងតែអាចទុកចិត្តបានក៏ដោយ។ លទ្ធផលគឺជាការតំណាងទូទៅដ៏រឹងមាំដែលអ្នកអាចដឹកនាំឆ្ពោះទៅរកការងារជាក់លាក់នៅពេលក្រោយ។.

ភាពខុសគ្នារវាងការជំរុញ ការលៃតម្រូវល្អិតល្អន់ LoRA និង RAG

ការជំរុញ​គឺជា​មធ្យោបាយ​លឿនបំផុត​ដើម្បី​ដឹកនាំ​ឥរិយាបថ​ដោយ​ប្រើ​ការណែនាំ ប៉ុន្តែ​វា​អាច​ផុយស្រួយ។ ការ​លៃតម្រូវ​ល្អិតល្អន់​បណ្តុះបណ្តាល​គំរូ​បន្ថែម​ទៀត​លើ​ឧទាហរណ៍​របស់​អ្នក​សម្រាប់​ឥរិយាបថ​ដែល​ស៊ីសង្វាក់​គ្នា​ជាង​មុន ប៉ុន្តែ​វា​បន្ថែម​ថ្លៃដើម និង​ការថែទាំ។ LoRA/adapters គឺជា​វិធីសាស្ត្រ​លៃតម្រូវ​ល្អិតល្អន់​ដែល​ស្រាល​ជាង ដែល​ជារឿយៗ​មាន​តម្លៃ​ថោក​ជាង និង​មាន​ម៉ូឌុល​ច្រើន​ជាង។ RAG ទាញយក​ឯកសារ​ពាក់ព័ន្ធ ហើយ​មាន​ចម្លើយ​គំរូ​ដោយ​ប្រើ​បរិបទ​នោះ ដែល​ជួយ​ដល់​ភាព​ស្រស់ថ្លា និង​មូលដ្ឋាន។.

ពេលណាត្រូវប្រើ RAG ជំនួសឱ្យការលៃតម្រូវល្អិតល្អន់

ជារឿយៗ RAG គឺជាជម្រើសដ៏រឹងមាំមួយនៅពេលដែលអ្នកត្រូវការចម្លើយដែលមានមូលដ្ឋានលើឯកសារបច្ចុប្បន្ន ឬមូលដ្ឋានចំណេះដឹងផ្ទៃក្នុងរបស់អ្នក។ វាអាចកាត់បន្ថយ "ការទាយ" ដោយផ្គត់ផ្គង់គំរូជាមួយនឹងបរិបទពាក់ព័ន្ធនៅពេលបង្កើត។ ការលៃតម្រូវដ៏ល្អិតល្អន់គឺសមស្របជាងនៅពេលដែលអ្នកត្រូវការរចនាប័ទ្មស្របគ្នា ឃ្លាដែន ឬឥរិយាបថដែលការជំរុញមិនអាចបង្កើតបានដោយភាពជឿជាក់។ ប្រព័ន្ធជាក់ស្តែងជាច្រើនរួមបញ្ចូលគ្នានូវការជំរុញ + RAG មុនពេលឈានដល់ការលៃតម្រូវដ៏ល្អិតល្អន់។.

របៀបកាត់បន្ថយការយល់ច្រឡំ និងទទួលបានចម្លើយដែលអាចទុកចិត្តបានជាងមុន

វិធីសាស្រ្តទូទៅមួយគឺត្រូវដាក់មូលដ្ឋានគ្រឹះលើគំរូជាមួយនឹងការទាញយក (RAG) ដើម្បីឱ្យវានៅជិតបរិបទដែលបានផ្តល់ឱ្យ។ អ្នកក៏អាចដាក់កម្រិតលទ្ធផលជាមួយគ្រោងការណ៍ តម្រូវឱ្យមានការហៅឧបករណ៍សម្រាប់ជំហានសំខាន់ៗ និងបន្ថែមការណែនាំ "កុំទាយ" ច្បាស់លាស់។ ស្រទាប់ផ្ទៀងផ្ទាត់ក៏សំខាន់ផងដែរ ដូចជាការត្រួតពិនិត្យច្បាប់ ការត្រួតពិនិត្យឆ្លង និងការពិនិត្យឡើងវិញដោយមនុស្សសម្រាប់ករណីប្រើប្រាស់ដែលមានហានិភ័យខ្ពស់។ ចាត់ទុកគំរូដូចជាជំនួយការប្រូបាប៊ីលីតេ មិនមែនជាប្រភពនៃសេចក្តីពិតតាមលំនាំដើមទេ។.

ហានិភ័យធំបំផុតជាមួយគំរូគ្រឹះក្នុងផលិតកម្ម

ហានិភ័យទូទៅរួមមាន ការយល់ច្រឡំ គំរូលំអៀង ឬគ្រោះថ្នាក់ពីទិន្នន័យបណ្តុះបណ្តាល និងការលេចធ្លាយភាពឯកជន ប្រសិនបើទិន្នន័យរសើបត្រូវបានដោះស្រាយមិនបានល្អ។ ប្រព័ន្ធក៏អាចងាយរងគ្រោះដោយសារការចាក់បញ្ចូលភ្លាមៗផងដែរ ជាពិសេសនៅពេលដែលគំរូអានអត្ថបទដែលមិនគួរឱ្យទុកចិត្តពីឯកសារ ឬខ្លឹមសារគេហទំព័រ។ ការកាត់បន្ថយជាធម្មតារួមមាន ការគ្រប់គ្រង ការដាក់ជាក្រុមក្រហម ការគ្រប់គ្រងការចូលប្រើ គំរូជំរុញដែលមានសុវត្ថិភាពជាងមុន និងការវាយតម្លៃដែលមានរចនាសម្ព័ន្ធ។ រៀបចំផែនការសម្រាប់ហានិភ័យទាំងនេះតាំងពីដំបូង ជាជាងការជួសជុលនៅពេលក្រោយ។.

ការចាក់បញ្ចូលភ្លាមៗ និងមូលហេតុដែលវាសំខាន់នៅក្នុងប្រព័ន្ធ RAG

ការចាក់បញ្ចូលភ្លាមៗ គឺជាពេលដែលអត្ថបទដែលមិនគួរឱ្យទុកចិត្តព្យាយាមជំនួសការណែនាំ ដូចជា "មិនអើពើនឹងការណែនាំមុនៗ" ឬ "បង្ហាញអាថ៌កំបាំង"។ នៅក្នុង RAG ឯកសារដែលទាញយកមកវិញអាចមានការណែនាំដែលមានគំនិតអាក្រក់ទាំងនោះ ហើយគំរូអាចធ្វើតាមពួកវា ប្រសិនបើអ្នកមិនប្រុងប្រយ័ត្ន។ វិធីសាស្រ្តទូទៅមួយគឺការញែកការណែនាំរបស់ប្រព័ន្ធ សម្អាតខ្លឹមសារដែលទាញយកមកវិញ និងពឹងផ្អែកលើគោលការណ៍ដែលមានមូលដ្ឋានលើឧបករណ៍ជាជាងការបញ្ចូលភ្លាមៗតែម្នាក់ឯង។ ការសាកល្បងជាមួយនឹងការបញ្ចូលផ្ទុយគ្នាជួយបង្ហាញពីចំណុចខ្សោយ។.

របៀបជ្រើសរើសម៉ូដែលគ្រឹះសម្រាប់ករណីប្រើប្រាស់របស់អ្នក

ចាប់ផ្តើមដោយកំណត់អ្វីដែលអ្នកត្រូវបង្កើត៖ អត្ថបទ រូបភាព អូឌីយ៉ូ កូដ ឬលទ្ធផលពហុម៉ូឌុល។ បន្ទាប់មកកំណត់របារការពិតរបស់អ្នក - ដែនដែលមានភាពត្រឹមត្រូវខ្ពស់ជារឿយៗត្រូវការការភ្ជាប់ដី (RAG) ការផ្ទៀងផ្ទាត់ និងជួនកាលការពិនិត្យឡើងវិញដោយមនុស្ស។ ពិចារណាពីភាពយឺតយ៉ាវ និងថ្លៃដើម ពីព្រោះគំរូដ៏រឹងមាំដែលយឺត ឬថ្លៃអាចពិបាកក្នុងការដឹកជញ្ជូន។ ជាចុងក្រោយ ភាពឯកជន និងការអនុលោមតាមផែនទីត្រូវការជម្រើសដាក់ពង្រាយ និងការគ្រប់គ្រង។.

ឯកសារយោង

  1. វិទ្យាស្ថានជាតិស្តង់ដារ និងបច្ចេកវិទ្យា (NIST) - គំរូគ្រឹះ (ពាក្យសទ្ទានុក្រម) - csrc.nist.gov

  2. វិទ្យាស្ថានជាតិស្តង់ដារ និងបច្ចេកវិទ្យា (NIST) - NIST AI 600-1៖ ទម្រង់ AI ដែលអាចបង្កើតបាន - nvlpubs.nist.gov

  3. វិទ្យាស្ថានជាតិស្តង់ដារ និងបច្ចេកវិទ្យា (NIST) - NIST AI 100-1: ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យ AI (AI RMF 1.0) - nvlpubs.nist.gov

  4. មជ្ឈមណ្ឌលស្រាវជ្រាវស្ទែនហ្វដលើគំរូគ្រឹះ (CRFM) - របាយការណ៍ - crfm.stanford.edu

  5. arXiv - ស្តីពីឱកាស និងហានិភ័យនៃគំរូមូលនិធិ (Bommasani et al., 2021) - arxiv.org

  6. arXiv - គំរូភាសាគឺជាអ្នករៀនដែលមានឱកាសតិចតួច (Brown et al., 2020) - arxiv.org

  7. arXiv - ការបង្កើត​ដែល​បាន​បង្កើន​ការ​ទាញ​យក​សម្រាប់​កិច្ចការ NLP ដែល​ពឹងផ្អែក​លើ​ចំណេះដឹង (Lewis et al., 2020) - arxiv.org

  8. arXiv - LoRA៖ ការសម្របខ្លួនកម្រិតទាបនៃគំរូភាសាធំៗ (Hu et al., 2021) - arxiv.org

  9. arXiv - BERT៖ ការបណ្តុះបណ្តាលជាមុននៃឧបករណ៍បំលែងទ្វេទិសជ្រៅសម្រាប់ការយល់ដឹងភាសា (Devlin et al., 2018) - arxiv.org

  10. arXiv - គំរូភាសាដែលបានកែសម្រួលគឺជាអ្នករៀនដែលមិនចាំបាច់ប្រើឧបករណ៍ (Wei et al., 2021) - arxiv.org

  11. បណ្ណាល័យឌីជីថល ACM - ការស្ទង់មតិអំពីការយល់ច្រឡំក្នុងការបង្កើតភាសាធម្មជាតិ (Ji et al., 2023) - dl.acm.org

  12. arXiv - ការរៀនគំរូដែលមើលឃើញដែលអាចផ្ទេរបានពីការត្រួតពិនិត្យភាសាធម្មជាតិ (Radford et al., 2021) - arxiv.org

  13. arXiv - គំរូប្រូបាប៊ីលីតេនៃការសាយភាយសំឡេងរំខាន (Ho et al., 2020) - arxiv.org

  14. arXiv - ការសំយោគរូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ជាមួយម៉ូដែលសាយភាយមិនទាន់ច្បាស់លាស់ (Rombach et al., 2021) - arxiv.org

  15. arXiv - ការទាញយក Dense Passage សម្រាប់ការឆ្លើយសំណួរ Open-Domain (Karpukhin et al., 2020) - arxiv.org

  16. arXiv - បណ្ណាល័យ Fais (Douze et al., 2024) - arxiv.org

  17. OpenAI - ណែនាំអំពី Whisper - openai.com

  18. arXiv - ការសំយោគ TTS ធម្មជាតិដោយការកំណត់លក្ខខណ្ឌ WaveNet លើការព្យាករណ៍វិសាលគម Mel (Shen et al., 2017) - arxiv.org

  19. មជ្ឈមណ្ឌលសន្តិសុខ និងបច្ចេកវិទ្យាដែលកំពុងលេចចេញ (CSET) សាកលវិទ្យាល័យ Georgetown - អំណាចដ៏គួរឱ្យភ្ញាក់ផ្អើលនៃការទស្សន៍ទាយពាក្យបន្ទាប់៖ ការពន្យល់អំពីគំរូភាសាធំៗ (ផ្នែកទី 1) - cset.georgetown.edu

  20. USENIX - ការស្រង់ទិន្នន័យបណ្តុះបណ្តាលពីគំរូភាសាធំៗ (Carlini et al., 2021) - usenix.org

  21. OWASP - LLM01: ការចាក់បញ្ចូលភ្លាមៗ - genai.owasp.org

  22. arXiv - ច្រើនជាងអ្វីដែលអ្នកបានស្នើសុំ៖ ការវិភាគដ៏ទូលំទូលាយអំពីការគំរាមកំហែងនៃការចាក់បញ្ចូលថ្មីចំពោះគំរូភាសាធំៗដែលរួមបញ្ចូលកម្មវិធី (Greshake et al., 2023) - arxiv.org

  23. ស៊េរីសន្លឹកបន្លំ OWASP - សន្លឹកបន្លំការពារការចាក់បញ្ចូល LLM - cheatsheetseries.owasp.org

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ