ចម្លើយខ្លី៖ គំរូគ្រឹះគឺជាគំរូ AI ធំៗ ដែលមានគោលបំណងទូទៅ ដែលត្រូវបានបណ្តុះបណ្តាលលើសំណុំទិន្នន័យដ៏ធំទូលាយ បន្ទាប់មកត្រូវបានសម្របខ្លួនទៅនឹងការងារជាច្រើន (ការសរសេរ ការស្វែងរក ការសរសេរកូដ រូបភាព) តាមរយៈការជំរុញ ការលៃតម្រូវ ឧបករណ៍ ឬការទាញយកមកវិញ។ ប្រសិនបើអ្នកត្រូវការចម្លើយដែលអាចទុកចិត្តបាន សូមផ្គូផ្គងពួកវាជាមួយនឹងការធ្វើមូលដ្ឋាន (ដូចជា RAG) ការរឹតបន្តឹងច្បាស់លាស់ និងការត្រួតពិនិត្យ ជាជាងការអនុញ្ញាតឱ្យពួកគេបង្កើតថ្មី។
ចំណុចសំខាន់ៗ៖
និយមន័យ ៖ គំរូមូលដ្ឋានដែលបានទទួលការបណ្តុះបណ្តាលយ៉ាងទូលំទូលាយមួយ ដែលត្រូវបានប្រើប្រាស់ឡើងវិញលើកិច្ចការជាច្រើន មិនមែនមួយភារកិច្ចក្នុងមួយគំរូនោះទេ។
ការសម្របខ្លួន ៖ ប្រើការជំរុញ ការលៃតម្រូវល្អិតល្អន់ LoRA/អាដាប់ទ័រ RAG និងឧបករណ៍ដើម្បីគ្រប់គ្រងឥរិយាបថ។
ភាពសមស្របសម្រាប់ការបង្កើត ៖ ពួកវាផ្តល់ថាមពលដល់ការបង្កើតអត្ថបទ រូបភាព អូឌីយ៉ូ កូដ និងការបង្កើតខ្លឹមសារពហុម៉ូឌុល។
សញ្ញាគុណភាព ៖ ផ្តល់អាទិភាពដល់ការគ្រប់គ្រង ការយល់ច្រឡំតិចជាងមុន សមត្ថភាពពហុមធ្យោបាយ និងការសន្និដ្ឋានប្រកបដោយប្រសិទ្ធភាព។
ការគ្រប់គ្រងហានិភ័យ ៖ ផែនការសម្រាប់ការយល់ច្រឡំ ការលំអៀង ការលេចធ្លាយព័ត៌មានឯកជន និងការចាក់បញ្ចូលរហ័សតាមរយៈការគ្រប់គ្រង និងការធ្វើតេស្ត។

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖
🔗 តើក្រុមហ៊ុន AI ជាអ្វី?
ស្វែងយល់ពីរបៀបដែលក្រុមហ៊ុន AI បង្កើតផលិតផល ក្រុមការងារ និងគំរូប្រាក់ចំណូល។.
🔗 តើកូដ AI មើលទៅដូចអ្វី
សូមមើលឧទាហរណ៍នៃកូដ AI ចាប់ពីម៉ូដែល Python រហូតដល់ APIs។.
🔗 តើក្បួនដោះស្រាយ AI ជាអ្វី?
ស្វែងយល់ពីអ្វីដែលជាក្បួនដោះស្រាយ AI និងរបៀបដែលពួកវាធ្វើការសម្រេចចិត្ត។.
🔗 តើបច្ចេកវិទ្យា AI ជាអ្វី?
ស្វែងយល់ពីបច្ចេកវិទ្យា AI ស្នូលដែលជំរុញស្វ័យប្រវត្តិកម្ម ការវិភាគ និងកម្មវិធីឆ្លាតវៃ។.
១) គំរូគ្រឹះ - និយមន័យគ្មានអ័ព្ទ 🧠
គំរូ គ្រឹះ គឺជាគំរូ AI ធំមួយសម្រាប់គោលបំណងទូទៅ ដែលត្រូវបានបណ្តុះបណ្តាលលើទិន្នន័យទូលំទូលាយ (ជាធម្មតាមានចំនួនច្រើន) ដូច្នេះវាអាចត្រូវបានសម្របទៅនឹងកិច្ចការជាច្រើន មិនមែនគ្រាន់តែមួយទេ ( NIST , Stanford CRFM )។
ជំនួសឲ្យការបង្កើតគំរូដាច់ដោយឡែកសម្រាប់៖
-
ការសរសេរអ៊ីមែល
-
ការឆ្លើយសំណួរ
-
ការសង្ខេបឯកសារ PDF
-
បង្កើតរូបភាព
-
ការចាត់ថ្នាក់សំបុត្រគាំទ្រ
-
ការបកប្រែភាសា
-
ការធ្វើការណែនាំអំពីកូដ
...អ្នកបណ្តុះបណ្តាលគំរូមូលដ្ឋានធំមួយដែល «រៀនពិភពលោក» តាមរបៀបស្ថិតិមិនច្បាស់លាស់ បន្ទាប់មកអ្នក សម្រប វាទៅនឹងការងារជាក់លាក់ជាមួយនឹងការជំរុញ ការលៃតម្រូវល្អិតល្អន់ ឬឧបករណ៍បន្ថែម ( Bommasani et al., 2021 )។
ម្យ៉ាងទៀតវាជា ម៉ាស៊ីនទូទៅ ដែលអ្នកអាចបើកបរបាន។
ហើយមែនហើយ ពាក្យគន្លឹះគឺ "ទូទៅ"។ នោះជាល្បិចទាំងមូល។.
២) តើគំរូគ្រឹះក្នុងបច្ចេកវិទ្យាបង្កើតឡើងដោយស្វ័យប្រវត្តិមានអ្វីខ្លះ? (តើវាសមនឹងចំណុចណាជាពិសេស) 🎨📝
ដូច្នេះ តើគំរូមូលដ្ឋាននៅក្នុង Generative AI មានអ្វីខ្លះ? ពួកវាជាគំរូមូលដ្ឋានដែលផ្តល់ថាមពលដល់ប្រព័ន្ធដែលអាច បង្កើត ខ្លឹមសារថ្មី - អត្ថបទ រូបភាព អូឌីយ៉ូ កូដ វីដេអូ និងល្បាយកាន់តែច្រើនឡើងៗនៃទាំងអស់នោះ ( NIST , NIST Generative AI Profile )។
បញ្ញាសិប្បនិម្មិត (AI) មិនមែនគ្រាន់តែអំពីការទស្សន៍ទាយស្លាកដូចជា "សារឥតបានការ / មិនមែនសារឥតបានការ" នោះទេ។ វានិយាយអំពីការផលិតលទ្ធផលដែលមើលទៅដូចជាវាត្រូវបានបង្កើតឡើងដោយមនុស្សម្នាក់។.
-
កថាខណ្ឌ
-
កំណាព្យ
-
ការពិពណ៌នាអំពីផលិតផល
-
រូបភាព
-
ភ្លេង
-
គំរូដើមកម្មវិធី
-
សំឡេងសំយោគ
-
ហើយពេលខ្លះមានទំនុកចិត្តលើខ្លួនឯងដោយមិនសមហេតុផល 🙃
គំរូគ្រឹះគឺ ជាពិសេស នៅទីនេះពីព្រោះ៖
-
ពួកគេបានស្រូបយកគំរូទូលំទូលាយពីសំណុំទិន្នន័យដ៏ធំ ( Bommasani et al., 2021 )
-
ពួកគេអាចធ្វើឱ្យទូទៅទៅជាការជំរុញថ្មីៗ (សូម្បីតែការជំរុញចម្លែកៗក៏ដោយ) ( Brown et al., 2020 )
-
ពួកវាអាចត្រូវបានប្រើប្រាស់ឡើងវិញសម្រាប់លទ្ធផលរាប់សិបដោយមិនចាំបាច់បណ្តុះបណ្តាលឡើងវិញពីដំបូង ( Bommasani et al., 2021 )
ពួកវាជា «ស្រទាប់មូលដ្ឋាន» - ដូចជាម្សៅនំប៉័ង។ អ្នកអាចដុតនំវាទៅជានំប៉័ងបាហ្គេត ភីហ្សា ឬនំស៊ីណាម៉ុន… មិនមែនជាពាក្យប្រៀបធៀបដ៏ល្អឥតខ្ចោះទេ ប៉ុន្តែអ្នកយល់ហើយ 😄
៣) ហេតុអ្វីបានជាពួកគេបានផ្លាស់ប្តូរអ្វីៗគ្រប់យ៉ាង (និងហេតុអ្វីបានជាមនុស្សមិនឈប់និយាយអំពីពួកគេ) 🚀
មុនពេលមានគំរូគ្រឹះ បញ្ញាសិប្បនិម្មិតជាច្រើនគឺជាក់លាក់ចំពោះភារកិច្ច៖
-
បណ្តុះបណ្តាលគំរូសម្រាប់ការវិភាគអារម្មណ៍
-
បណ្តុះបណ្តាលអ្នកបកប្រែម្នាក់ទៀត
-
បណ្តុះបណ្តាលមួយផ្សេងទៀតសម្រាប់ការចាត់ថ្នាក់រូបភាព
-
បណ្តុះបណ្តាលមួយផ្សេងទៀតសម្រាប់ការទទួលស្គាល់អង្គភាពដែលមានឈ្មោះ
វាដំណើរការបាន ប៉ុន្តែវាយឺត ថ្លៃ និងផុយស្រួយបន្តិច។.
គំរូមូលនិធិបានបង្វែរវា៖
-
ហ្វឹកហាត់ជាមុនម្តង (ការខិតខំប្រឹងប្រែងយ៉ាងខ្លាំង)
-
ប្រើឡើងវិញនៅគ្រប់ទីកន្លែង (ការសងធំ) ( Bommasani et al., 2021 )
ការប្រើប្រាស់ឡើងវិញនោះគឺជាការគុណ។ ក្រុមហ៊ុននានាអាចបង្កើតលក្ខណៈពិសេសចំនួន 20 នៅលើកំពូលនៃគ្រួសារម៉ូដែលមួយ ជាជាងការបង្កើតកង់ឡើងវិញចំនួន 20 ដង។.
ជាងនេះទៅទៀត បទពិសោធន៍អ្នកប្រើប្រាស់ក៏កាន់តែមានលក្ខណៈធម្មជាតិផងដែរ៖
-
អ្នកមិន "ប្រើឧបករណ៍ចាត់ថ្នាក់" ទេ
-
អ្នកនិយាយជាមួយតារាម៉ូដែលដូចជាមិត្តរួមការងារដែលជួយយើងយ៉ាងមានប្រយោជន៍ ដែលមិនដែលដេកលក់ ☕🤝
ពេលខ្លះវាក៏ដូចជាមិត្តរួមការងារម្នាក់ដែលយល់ច្រឡំគ្រប់យ៉ាងដោយទំនុកចិត្ត ប៉ុន្តែអ្ហា៎! ការរីកចម្រើន។.
៤) គំនិតស្នូល៖ ការហ្វឹកហ្វឺនជាមុន + ការសម្របខ្លួន 🧩
គំរូគ្រឹះស្ទើរតែទាំងអស់ធ្វើតាមគំរូមួយ ( Stanford CRFM , NIST ):
ការបណ្តុះបណ្តាលជាមុន (ដំណាក់កាល "ស្រូបយកអ៊ីនធឺណិត") 📚
គំរូនេះត្រូវបានបណ្តុះបណ្តាលលើសំណុំទិន្នន័យដ៏ធំ និងទូលំទូលាយដោយប្រើប្រាស់ការរៀនសូត្រដោយខ្លួនឯង ( NIST )។ ចំពោះគំរូភាសា ជាធម្មតាមានន័យថាការទស្សន៍ទាយពាក្យដែលបាត់ ឬសញ្ញាសម្គាល់បន្ទាប់ ( Devlin et al., 2018 , Brown et al., 2020 )។
ចំណុចសំខាន់មិនមែនបង្រៀនវានូវកិច្ចការតែមួយនោះទេ។ ចំណុចសំខាន់គឺបង្រៀនវា អំពីការតំណាងទូទៅ ៖
-
វេយ្យាករណ៍
-
ការពិត (ប្រភេទ)
-
គំរូនៃការវែកញែក (ពេលខ្លះ)
-
រចនាប័ទ្មសរសេរ
-
រចនាសម្ព័ន្ធកូដ
-
ចេតនារបស់មនុស្សទូទៅ
ការសម្របខ្លួន (ដំណាក់កាល "ធ្វើឱ្យវាជាក់ស្តែង") 🛠️
បន្ទាប់មកអ្នកសម្របវាដោយប្រើមួយ ឬច្រើននៃ៖
-
ការជំរុញ (ការណែនាំជាភាសាសាមញ្ញ)
-
ការលៃតម្រូវការណែនាំ (ហ្វឹកហាត់វាឱ្យធ្វើតាមការណែនាំ) ( Wei et al., 2021 )
-
ការលៃតម្រូវដ៏ល្អិតល្អន់ (ការបណ្តុះបណ្តាលលើទិន្នន័យដូមេនរបស់អ្នក)
-
LoRA / អាដាប់ទ័រ (វិធីសាស្ត្រលៃតម្រូវទម្ងន់ស្រាល) ( Hu et al., 2021 )
-
RAG (ជំនាន់ទាញយកបន្ថែម - គំរូពិគ្រោះជាមួយឯកសាររបស់អ្នក) ( Lewis et al., 2020 )
-
ការប្រើប្រាស់ឧបករណ៍ (មុខងារហៅទូរសព្ទ ការរុករកប្រព័ន្ធខាងក្នុង។ល។)
នេះជាមូលហេតុដែលគំរូមូលដ្ឋានដូចគ្នាអាចសរសេរឈុតឆាកស្នេហា... បន្ទាប់មកជួយបំបាត់កំហុសសំណួរ SQL ប្រាំវិនាទីក្រោយមក 😭
៥) តើអ្វីទៅដែលធ្វើឱ្យគំរូគ្រឹះមួយមានលក្ខណៈល្អ? ✅
នេះជាផ្នែកដែលមនុស្សរំលង ហើយបន្ទាប់មកស្ដាយក្រោយ។.
គំរូគ្រឹះ «ល្អ» មិនមែនគ្រាន់តែ «ធំជាង» នោះទេ។ ធំជាងជួយបាន ពិតណាស់… ប៉ុន្តែវាមិនមែនជារឿងតែមួយគត់នោះទេ។ គំរូគ្រឹះដ៏ល្អជាធម្មតាមាន៖
ការធ្វើឱ្យមានលក្ខណៈទូទៅខ្លាំង 🧠
វាដំណើរការបានល្អលើភារកិច្ចជាច្រើនដោយមិនចាំបាច់មានការបណ្តុះបណ្តាលឡើងវិញជាក់លាក់តាមភារកិច្ចនោះទេ ( Bommasani et al., 2021 )។
ការបើកបរ និង ការគ្រប់គ្រង 🎛️
វាអាចអនុវត្តតាមការណែនាំដូចជា៖
-
«ត្រូវសង្ខេប»
-
«ប្រើចំណុចសំខាន់ៗ»
-
«សរសេរដោយសំឡេងរួសរាយរាក់ទាក់»
-
«កុំបង្ហាញព័ត៌មានសម្ងាត់»
ម៉ូដែលខ្លះឆ្លាតណាស់តែរអិល។ ដូចជាការព្យាយាមកាន់សាប៊ូមួយដុំក្នុងបន្ទប់ទឹកអញ្ចឹង។ មានប្រយោជន៍ ប៉ុន្តែមិនទៀងទាត់ 😅
ទំនោរនៃការយល់ច្រឡំទាប (ឬយ៉ាងហោចណាស់ភាពមិនប្រាកដប្រជាដោយស្មោះត្រង់) 🧯
គ្មានគំរូណាដែលមានភាពស៊ាំនឹងការយល់ច្រឡំនោះទេ ប៉ុន្តែគំរូល្អៗ៖
-
យល់ច្រឡំតិចជាង
-
ទទួលស្គាល់ភាពមិនប្រាកដប្រជាញឹកញាប់ជាងមុន
-
រក្សាភាពជិតស្និទ្ធនឹងបរិបទដែលបានផ្ដល់ឲ្យនៅពេលប្រើការទាញយក ( Ji et al., 2023 , Lewis et al., 2020 )
សមត្ថភាពពហុម៉ូឌុលល្អ (នៅពេលចាំបាច់) 🖼️🎧
ប្រសិនបើអ្នកកំពុងសាងសង់ជំនួយការដែលអានរូបភាព បកស្រាយតារាង ឬយល់សំឡេង ពហុម៉ូឌុលមានសារៈសំខាន់ខ្លាំងណាស់ ( Radford et al., 2021 )។
ការសន្និដ្ឋានប្រកបដោយប្រសិទ្ធភាព ⚡
ភាពយឺតយ៉ាវ និងតម្លៃគឺជារឿងសំខាន់។ ម៉ូដែលដែលខ្លាំង ប៉ុន្តែយឺត គឺដូចជារថយន្តស្ព័រដែលមានសំបកកង់បែក។.
ឥរិយាបថសុវត្ថិភាព និងការសម្របសម្រួល 🧩
មិនត្រឹមតែ «បដិសេធអ្វីៗទាំងអស់» ប៉ុណ្ណោះទេ ប៉ុន្តែ៖
-
ជៀសវាងការណែនាំដែលបង្កគ្រោះថ្នាក់
-
កាត់បន្ថយភាពលំអៀង
-
ដោះស្រាយប្រធានបទរសើបដោយប្រុងប្រយ័ត្ន
-
ទប់ទល់នឹងការប៉ុនប៉ង jailbreak ជាមូលដ្ឋាន (ខ្លះ…) ( NIST AI RMF 1.0 , NIST Generative AI Profile )
ឯកសារ + ប្រព័ន្ធអេកូឡូស៊ី 🌱
នេះស្តាប់ទៅដូចជាស្ងួតបន្តិច ប៉ុន្តែវាជាការពិត៖
-
ឧបករណ៍
-
ខ្សែក្រវាត់ eval
-
ជម្រើសដាក់ពង្រាយ
-
ការគ្រប់គ្រងសហគ្រាស
-
ការគាំទ្រការលៃតម្រូវល្អិតល្អន់
មែនហើយ «ប្រព័ន្ធអេកូឡូស៊ី» គឺជាពាក្យមិនច្បាស់លាស់មួយ។ ខ្ញុំក៏ស្អប់វាដែរ។ ប៉ុន្តែវាសំខាន់ណាស់។.
៦) តារាងប្រៀបធៀប - ជម្រើសគំរូគ្រឹះទូទៅ (និងអ្វីដែលវាល្អសម្រាប់) 🧾
ខាងក្រោមនេះគឺជាតារាងប្រៀបធៀបជាក់ស្តែង ដែលមិនល្អឥតខ្ចោះបន្តិច។ វាមិនមែនជា "បញ្ជីពិតតែមួយ" ទេ វាដូចជាអ្វីដែលមនុស្សជ្រើសរើសនៅក្នុងព្រៃ។.
| ប្រភេទឧបករណ៍/ម៉ូដែល | ទស្សនិកជន | ថ្លៃដូច | ហេតុអ្វីបានជាវាដំណើរការ |
|---|---|---|---|
| LLM ផ្ទាល់ខ្លួន (រចនាប័ទ្មជជែក) | ក្រុមដែលចង់បានល្បឿន + ការកែលម្អ | ផ្អែកលើការប្រើប្រាស់ / ការជាវ | ការអនុវត្តតាមការណែនាំដ៏ល្អ ការអនុវត្តទូទៅដ៏រឹងមាំ ជាធម្មតាល្អបំផុត "ក្រៅប្រអប់" 😌 |
| LLM ទម្ងន់បើកចំហ (អាចធ្វើជាម្ចាស់ផ្ទះដោយខ្លួនឯងបាន) | អ្នកសាងសង់ដែលចង់គ្រប់គ្រង | ថ្លៃដើមហេដ្ឋារចនាសម្ព័ន្ធ (និងបញ្ហាឈឺក្បាល) | អាចប្ដូរតាមបំណងបាន ងាយស្រួលសម្រាប់ភាពឯកជន អាចដំណើរការក្នុងមូលដ្ឋាន… ប្រសិនបើអ្នកចូលចិត្តលេងសើចនៅពាក់កណ្តាលអធ្រាត្រ |
| ម៉ាស៊ីនបង្កើតរូបភាពសាយភាយ | ក្រុមច្នៃប្រឌិត, ក្រុមរចនា | ពីឥតគិតថ្លៃទៅបង់ប្រាក់ | ការសំយោគរូបភាពដ៏ល្អឥតខ្ចោះ ភាពចម្រុះនៃរចនាប័ទ្ម លំហូរការងារម្តងហើយម្តងទៀត (ក៏៖ ម្រាមដៃអាចនឹងមានបញ្ហា) ✋😬 ( Ho et al., 2020 , Rombach et al., 2021 ) |
| គំរូ "ចក្ខុវិស័យ-ភាសា" ពហុម៉ូឌុល | កម្មវិធីដែលអានរូបភាព + អត្ថបទ | ផ្អែកលើការប្រើប្រាស់ | អនុញ្ញាតឱ្យអ្នកសួរសំណួរអំពីរូបភាព រូបថតអេក្រង់ ដ្យាក្រាម - មានប្រយោជន៍គួរឱ្យភ្ញាក់ផ្អើល ( Radford et al., 2021 ) |
| គំរូគ្រឹះដែលបង្កប់ | ប្រព័ន្ធស្វែងរក + RAG | តម្លៃទាបក្នុងមួយការហៅ | ប្រែក្លាយអត្ថបទទៅជាវ៉ិចទ័រសម្រាប់ការស្វែងរកន័យវិទ្យា ការដាក់ជាក្រុម ការណែនាំ - ថាមពល MVP ស្ងាត់ៗ ( Karpukhin et al., 2020 , Douze et al., 2024 ) |
| គំរូមូលដ្ឋាននៃការនិយាយទៅជាអត្ថបទ | មជ្ឈមណ្ឌលហៅទូរសព្ទ, អ្នកបង្កើត | ផ្អែកលើការប្រើប្រាស់ / ក្នុងស្រុក | ការចម្លងអត្ថបទលឿន ការគាំទ្រច្រើនភាសា ល្អគ្រប់គ្រាន់សម្រាប់សំឡេងរំខាន (ជាធម្មតា) 🎙️ ( ខ្សឹប ) |
| គំរូមូលដ្ឋានអត្ថបទទៅជាការនិយាយ | ក្រុមផលិតផល, ប្រព័ន្ធផ្សព្វផ្សាយ | ផ្អែកលើការប្រើប្រាស់ | ការបង្កើតសំឡេងធម្មជាតិ រចនាប័ទ្មសំឡេង ការនិទានរឿង - អាចក្លាយជារឿងគួរឱ្យខ្លាច-ពិត ( Shen et al., 2017 ) |
| LLM ដែលផ្តោតលើកូដ | អ្នកអភិវឌ្ឍន៍ | ផ្អែកលើការប្រើប្រាស់ / ការជាវ | ពូកែខាងកូដ កែកំហុស កែសម្រួលឡើងវិញ… នៅតែមិនមែនជាអ្នកអានគំនិតទេ 😅 |
សូមកត់សម្គាល់ថា "គំរូគ្រឹះ" មិនត្រឹមតែមានន័យថា "chatbot" នោះទេ។ ការបង្កប់ និងគំរូសុន្ទរកថាក៏អាចជាមូលដ្ឋានផងដែរ ពីព្រោះពួកវាមានលក្ខណៈទូលំទូលាយ និងអាចប្រើឡើងវិញបាននៅទូទាំងកិច្ចការនានា ( Bommasani et al., 2021 , NIST )។
៧) ក្រឡេកមើលឱ្យកាន់តែជិត៖ របៀបដែលគំរូគ្រឹះភាសារៀន (កំណែ vibe) 🧠🧃
គំរូគ្រឹះភាសា (ជារឿយៗត្រូវបានគេហៅថា LLMs) ជាធម្មតាត្រូវបានបណ្តុះបណ្តាលលើការប្រមូលអត្ថបទយ៉ាងច្រើន។ ពួកគេរៀនដោយការទស្សន៍ទាយសញ្ញាសម្ងាត់ ( Brown et al., 2020 )។ ប៉ុណ្ណឹងហើយ។ គ្មានធូលីទេពអប្សរសម្ងាត់ទេ។
ប៉ុន្តែមន្តអាគមគឺថា ការទស្សន៍ទាយថូខឹនបង្ខំឱ្យគំរូរៀនរចនាសម្ព័ន្ធ ( CSET )៖
-
វេយ្យាករណ៍ និង វាក្យសម្ព័ន្ធ
-
ទំនាក់ទំនងប្រធានបទ
-
គំរូដូចជាការវែកញែក (ពេលខ្លះ)
-
លំដាប់ទូទៅនៃការគិត
-
របៀបដែលមនុស្សពន្យល់រឿងต่างๆ ឈ្លោះប្រកែកគ្នា សុំទោស ចរចា បង្រៀន
វាដូចជាការរៀនធ្វើត្រាប់តាមការសន្ទនារាប់លានដោយមិន "យល់" ពីរបៀបដែលមនុស្សធ្វើ។ ដែលស្តាប់ទៅដូចជាវាមិនគួរដំណើរការទេ... ប៉ុន្តែវានៅតែបន្តដំណើរការ។.
ការនិយាយបំផ្លើសបន្តិចបន្តួច៖ វាដូចជាការបង្ហាប់ការសរសេររបស់មនុស្សទៅក្នុងខួរក្បាលប្រូបាប៊ីលីតេដ៏ធំមួយ។
ម្យ៉ាងវិញទៀត ពាក្យប្រៀបធៀបនោះហាក់ដូចជាត្រូវបណ្តាសាបន្តិច។ ប៉ុន្តែយើងផ្លាស់ប្តូរ 😄
៨) ក្រឡេកមើលឱ្យកាន់តែជិត៖ គំរូសាយភាយ (ហេតុអ្វីបានជារូបភាពដំណើរការខុសគ្នា) 🎨🌀
គំរូគ្រឹះរូបភាពច្រើនតែប្រើ វិធីសាស្ត្រ សាយភាយ Ho et al., 2020 , Rombach et al., 2021 )។
គំនិតដ៏លំបាក៖
-
បន្ថែមសំឡេងរំខានទៅរូបភាពរហូតដល់ពួកវាជាមូលដ្ឋានទូរទស្សន៍ឋិតិវន្ត
-
បង្វឹកគំរូមួយដើម្បីបញ្ច្រាសសំឡេងរំខាននោះមួយជំហានម្តងៗ
-
នៅពេលបង្កើត សូមចាប់ផ្តើមជាមួយនឹងសំឡេងរំខាន ហើយ "បន្ថយសំឡេងរំខាន" ទៅជារូបភាពដែលដឹកនាំដោយការណែនាំ ( Ho et al., 2020 )
នេះជាមូលហេតុដែលការបង្កើតរូបភាពមានអារម្មណ៍ដូចជា "ការអភិវឌ្ឍ" រូបថតមួយសន្លឹក លើកលែងតែរូបថតនោះគឺជានាគពាក់ស្បែកជើងប៉ាតានៅក្នុងច្រកផ្សារទំនើប 🛒🐉
ម៉ូដែលសាយភាយគឺល្អពីព្រោះ៖
-
ពួកគេបង្កើតរូបភាពដែលមានគុណភាពខ្ពស់
-
ពួកគេអាចត្រូវបានដឹកនាំយ៉ាងខ្លាំងដោយអត្ថបទ
-
ពួកគេគាំទ្រការកែលម្អម្តងហើយម្តងទៀត (បំរែបំរួល ការលាបពណ៌ ការបង្កើនទំហំ) ( Rombach et al., 2021 )
ពេលខ្លះពួកគេក៏តស៊ូជាមួយ៖
-
ការបង្ហាញអត្ថបទនៅខាងក្នុងរូបភាព
-
ព័ត៌មានលម្អិតកាយវិភាគសាស្ត្រល្អិតល្អន់
-
អត្តសញ្ញាណតួអង្គដែលស៊ីសង្វាក់គ្នានៅទូទាំងឈុតឆាក (វាកំពុងប្រសើរឡើង ប៉ុន្តែនៅតែមាន)
៩) ក្រឡេកមើលឲ្យកាន់តែជិត៖ គំរូគ្រឹះពហុម៉ូឌុល (អត្ថបទ + រូបភាព + សំឡេង) 👀🎧📝
គំរូគ្រឹះពហុម៉ូឌុលមានគោលបំណងយល់ និងបង្កើតទិន្នន័យឆ្លងកាត់ប្រភេទទិន្នន័យច្រើនប្រភេទ៖
-
អត្ថបទ
-
រូបភាព
-
អូឌីយ៉ូ
-
វីដេអូ
-
ពេលខ្លះធាតុចូលដូចឧបករណ៍ចាប់សញ្ញា ( ទម្រង់ AI បង្កើតដោយ NIST )
ហេតុអ្វីបានជារឿងនេះសំខាន់ក្នុងជីវិតពិត៖
-
ការគាំទ្រអតិថិជនអាចបកស្រាយរូបថតអេក្រង់
-
ឧបករណ៍ភាពងាយស្រួលអាចពណ៌នាអំពីរូបភាព
-
កម្មវិធីអប់រំអាចពន្យល់ដ្យាក្រាម
-
អ្នកបង្កើតអាចកែច្នៃទម្រង់ឡើងវិញបានយ៉ាងឆាប់រហ័ស
-
ឧបករណ៍អាជីវកម្មអាច "អាន" រូបថតអេក្រង់ផ្ទាំងគ្រប់គ្រង ហើយសង្ខេបវា
នៅក្រោមគម្រប ប្រព័ន្ធពហុម៉ូឌុលច្រើនតែតម្រឹមការតំណាង៖
-
បង្វែររូបភាពទៅជាការបង្កប់
-
បំលែងអត្ថបទទៅជាការបង្កប់
-
រៀនកន្លែងចែករំលែកមួយដែលពាក្យ “ឆ្មា” ផ្គូផ្គងនឹងភីកសែលឆ្មា 😺 ( Radford et al., 2021 )
វាមិនតែងតែឆើតឆាយនោះទេ។ ពេលខ្លះវាត្រូវបានដេរភ្ជាប់គ្នាដូចជាភួយ។ ប៉ុន្តែវាដំណើរការ។.
១០) ការលៃតម្រូវល្អិតល្អន់ ទល់នឹង ការជំរុញ ទល់នឹង RAG (របៀបដែលអ្នកសម្របគំរូមូលដ្ឋាន) 🧰
ប្រសិនបើអ្នកកំពុងព្យាយាមធ្វើឱ្យគំរូគ្រឹះមួយអាចអនុវត្តបានសម្រាប់វិស័យជាក់លាក់មួយ (ផ្នែកច្បាប់ វេជ្ជសាស្ត្រ សេវាកម្មអតិថិជន ចំណេះដឹងផ្ទៃក្នុង) អ្នកមានចំណុចសំខាន់ៗមួយចំនួន៖
ជំរុញចិត្ត🗣️
លឿនបំផុត និងសាមញ្ញបំផុត។.
-
គុណសម្បត្តិ៖ មិនចាំបាច់ហ្វឹកហាត់ ការធ្វើម្តងទៀតភ្លាមៗ
-
គុណវិបត្តិ៖ អាចមិនស៊ីសង្វាក់គ្នា ដែនកំណត់បរិបទ ភាពផុយស្រួយភ្លាមៗ
ការលៃតម្រូវយ៉ាងល្អិតល្អន់ 🎯
បណ្តុះបណ្តាលគំរូបន្ថែមទៀតលើឧទាហរណ៍របស់អ្នក។.
-
គុណសម្បត្តិ៖ ឥរិយាបថកាន់តែស៊ីសង្វាក់គ្នា ភាសាដែនកាន់តែប្រសើរ អាចកាត់បន្ថយប្រវែងនៃប្រអប់បញ្ចូល
-
គុណវិបត្តិ៖ តម្លៃ តម្រូវការគុណភាពទិន្នន័យ ហានិភ័យនៃការបំពេញលើសកម្រិត ការថែទាំ
ការលៃតម្រូវទម្ងន់ស្រាល (LoRA / អាដាប់ទ័រ) 🧩
កំណែដែលមានប្រសិទ្ធភាពជាងមុននៃការលៃតម្រូវល្អិតល្អន់ ( Hu et al., 2021 )។
-
គុណសម្បត្តិ៖ ថោកជាង, ម៉ូឌុល, ងាយស្រួលប្តូរ
-
គុណវិបត្តិ៖ នៅតែត្រូវការការបណ្តុះបណ្តាល និងការវាយតម្លៃ
RAG (ជំនាន់ទាញយកបន្ថែម) 🔎
គំរូនេះទាញយកឯកសារពាក់ព័ន្ធពីមូលដ្ឋានចំណេះដឹងរបស់អ្នក និងចម្លើយដោយប្រើប្រាស់ពួកវា ( Lewis et al., 2020 )។
-
គុណសម្បត្តិ៖ ចំណេះដឹងថ្មីៗ ការដកស្រង់សម្តីពីខាងក្នុង (ប្រសិនបើអ្នកអនុវត្តវា) ការបណ្តុះបណ្តាលឡើងវិញតិចជាងមុន។
-
គុណវិបត្តិ៖ គុណភាពនៃការទាញយកអាចធ្វើឱ្យវាជោគជ័យ ឬបរាជ័យ ត្រូវការការបំបែកល្អ + ការបង្កប់
ការនិយាយពិត៖ ប្រព័ន្ធជោគជ័យជាច្រើនរួមបញ្ចូលគ្នានូវការជំរុញ + RAG។ ការលៃតម្រូវល្អិតល្អន់គឺមានឥទ្ធិពលខ្លាំង ប៉ុន្តែមិនចាំបាច់ជានិច្ចនោះទេ។ មនុស្សលោតទៅរកវាលឿនពេកព្រោះវាស្តាប់ទៅគួរឱ្យចាប់អារម្មណ៍ 😅
១១) ហានិភ័យ ដែនកំណត់ និងផ្នែក “សូមកុំដាក់ពង្រាយរឿងនេះដោយងងឹតងងល់” 🧯😬
គំរូគ្រឹះមានឥទ្ធិពលខ្លាំង ប៉ុន្តែវាមិនស្ថិតស្ថេរដូចកម្មវិធីប្រពៃណីទេ។ ពួកវាដូចជា… អ្នកហាត់ការដ៏មានទេពកោសល្យដែលមានបញ្ហាទំនុកចិត្ត។.
ដែនកំណត់សំខាន់ៗសម្រាប់ផែនការ៖
ការយល់ច្រឡំ 🌀
ម៉ូដែលអាចបង្កើត៖
-
ប្រភពក្លែងក្លាយ
-
ការពិតមិនត្រឹមត្រូវ
-
ជំហានដែលអាចជឿទុកចិត្តបាន ប៉ុន្តែខុស ( Ji et al., 2023 )
ការកាត់បន្ថយ៖
-
RAG ជាមួយបរិបទដែលមានមូលដ្ឋាន ( Lewis et al., 2020 )
-
លទ្ធផលដែលមានកម្រិត (គ្រោងការណ៍ ការហៅឧបករណ៍)
-
ការណែនាំច្បាស់លាស់ "កុំទាយ"
-
ស្រទាប់ផ្ទៀងផ្ទាត់ (ច្បាប់ ការត្រួតពិនិត្យឆ្លងកាត់ ការពិនិត្យឡើងវិញដោយមនុស្ស)
ភាពលំអៀង និងលំនាំដែលបង្កគ្រោះថ្នាក់ ⚠️
ដោយសារតែទិន្នន័យបណ្តុះបណ្តាលឆ្លុះបញ្ចាំងពីមនុស្ស អ្នកអាចទទួលបាន៖
-
គំរូនិយម
-
ការអនុវត្តមិនស្មើគ្នានៅទូទាំងក្រុម
-
ការបញ្ចប់ដែលមិនមានសុវត្ថិភាព ( NIST AI RMF 1.0 , Bommasani et al ។ , 2021 )
ការកាត់បន្ថយ៖
-
ការលៃតម្រូវសុវត្ថិភាព
-
ក្រុមក្រហម
-
តម្រងមាតិកា
-
ការរឹតបន្តឹងដូមេនដោយប្រុងប្រយ័ត្ន ( ទម្រង់ AI ជំនាន់ NIST )
ភាពឯកជន និងការលេចធ្លាយទិន្នន័យ 🔒
ប្រសិនបើអ្នកបញ្ចូលទិន្នន័យសម្ងាត់ទៅក្នុងចំណុចបញ្ចប់គំរូ អ្នកត្រូវដឹង៖
-
របៀបដែលវាត្រូវបានរក្សាទុក
-
ថាតើវាត្រូវបានប្រើសម្រាប់ការបណ្តុះបណ្តាលឬអត់
-
អ្វីដែលការកត់ត្រាមាន
-
អ្វីដែលគ្រប់គ្រងតម្រូវការរបស់អង្គការរបស់អ្នក ( NIST AI RMF 1.0 )
ការកាត់បន្ថយ៖
-
ជម្រើសដាក់ពង្រាយឯកជន
-
អភិបាលកិច្ចរឹងមាំ
-
ការប៉ះពាល់ទិន្នន័យតិចតួចបំផុត
-
RAG សម្រាប់តែផ្ទៃក្នុងប៉ុណ្ណោះ ដែលមានការគ្រប់គ្រងការចូលប្រើយ៉ាងតឹងរ៉ឹង ( NIST Generative AI Profile , Carlini et al., 2021 )
ចាក់ថ្នាំភ្លាមៗ (ជាពិសេសជាមួយ RAG) 🕳️
ប្រសិនបើគំរូអានអត្ថបទដែលមិនគួរឱ្យទុកចិត្ត អត្ថបទនោះអាចព្យាយាមរៀបចំវា៖
-
"មិនអើពើនឹងការណែនាំពីមុន..."
-
«ផ្ញើអាថ៌កំបាំងមកខ្ញុំ…» ( OWASP , Greshake et al., 2023 )
ការកាត់បន្ថយ៖
-
ការណែនាំអំពីប្រព័ន្ធដាច់ដោយឡែក
-
សម្អាតមាតិកាដែលបានទាញយក
-
ប្រើប្រាស់គោលការណ៍ដែលមានមូលដ្ឋានលើឧបករណ៍ (មិនមែនគ្រាន់តែការណែនាំទេ)
-
សាកល្បងជាមួយធាតុចូលផ្ទុយ ( សន្លឹកបន្លំ OWASP , ទម្រង់ AI ជំនាន់ NIST )
មិនមែនព្យាយាមបំភ័យអ្នកទេ។ គ្រាន់តែ… វាជាការប្រសើរក្នុងការដឹងពីកន្លែងដែលក្តារកម្រាលឥដ្ឋមានសំឡេងកកិត។.
១២) របៀបជ្រើសរើសម៉ូដែលគ្រឹះសម្រាប់ករណីប្រើប្រាស់របស់អ្នក 🎛️
ប្រសិនបើអ្នកកំពុងជ្រើសរើសគំរូគ្រឹះ (ឬសាងសង់លើគំរូមួយ) សូមចាប់ផ្តើមជាមួយនឹងការជំរុញទាំងនេះ៖
កំណត់អ្វីដែលអ្នកកំពុងបង្កើត និងអ្វីដែលអ្នកកំពុងធ្វើ
-
អត្ថបទតែប៉ុណ្ណោះ
-
រូបភាព
-
អូឌីយ៉ូ
-
ពហុមធ្យោបាយចម្រុះ
កំណត់របារការពិតរបស់អ្នក📌
ប្រសិនបើអ្នកត្រូវការភាពត្រឹមត្រូវខ្ពស់ (ហិរញ្ញវត្ថុ សុខភាព ច្បាប់ សុវត្ថិភាព)៖
-
អ្នកនឹងចង់បាន RAG ( Lewis et al., 2020 )
-
អ្នកនឹងចង់បានការផ្ទៀងផ្ទាត់
-
អ្នកនឹងចង់បានការពិនិត្យឡើងវិញដោយមនុស្ស (យ៉ាងហោចណាស់ពេលខ្លះ) ( NIST AI RMF 1.0 )
សម្រេចចិត្តលើគោលដៅភាពយឺតយ៉ាវរបស់អ្នក ⚡
ការជជែកអាចធ្វើឡើងភ្លាមៗ។ ការសង្ខេបជាបាច់អាចយឺតជាង។
ប្រសិនបើអ្នកត្រូវការការឆ្លើយតបភ្លាមៗ ទំហំម៉ូដែល និងការបង្ហោះគឺជារឿងសំខាន់។
តម្រូវការឯកជនភាព និងការអនុលោមតាមផែនទី 🔐
ក្រុមខ្លះត្រូវការ៖
-
ការដាក់ពង្រាយនៅនឹងកន្លែង / VPC
-
គ្មានការរក្សាទុកទិន្នន័យ
-
កំណត់ហេតុត្រួតពិនិត្យយ៉ាងតឹងរ៉ឹង
-
ការគ្រប់គ្រងការចូលប្រើក្នុងមួយឯកសារ ( NIST AI RMF 1.0 , NIST Generative AI Profile )
ធ្វើឱ្យមានតុល្យភាពថវិកា - និងការអត់ធ្មត់ប្រតិបត្តិការ 😅
ការបង្ហោះដោយខ្លួនឯងផ្តល់នូវការគ្រប់គ្រង ប៉ុន្តែបន្ថែមភាពស្មុគស្មាញ។
API ដែលត្រូវបានគ្រប់គ្រងគឺងាយស្រួល ប៉ុន្តែអាចមានតម្លៃថ្លៃ និងមិនសូវអាចប្ដូរតាមបំណងបាន។
គន្លឹះជាក់ស្តែងតូចមួយ៖ គំរូដើមជាមួយនឹងអ្វីដែលងាយស្រួលជាមុនសិន បន្ទាប់មកធ្វើឱ្យរឹងនៅពេលក្រោយ។ ការចាប់ផ្តើមជាមួយនឹងការរៀបចំ "ល្អឥតខ្ចោះ" ជាធម្មតាធ្វើឱ្យអ្វីៗដំណើរការយឺត។.
១៣) តើគំរូគ្រឹះក្នុងបញ្ញាសិប្បនិម្មិតបង្កើតឡើងមានអ្វីខ្លះ? (គំរូផ្លូវចិត្តរហ័ស) 🧠✨
ចូរយើងយកវាមកវិញ។ តើគំរូគ្រឹះនៅក្នុង Generative AI ជាអ្វី?
ពួកគេគឺ៖
-
គំរូទូទៅធំៗ ដែលបានបណ្តុះបណ្តាលលើទិន្នន័យទូលំទូលាយ ( NIST , Stanford CRFM )
-
មានសមត្ថភាពបង្កើតខ្លឹមសារ (អត្ថបទ រូបភាព សំឡេង។ល។) ( ទម្រង់ AI ទូទៅរបស់ NIST )
-
អាចសម្របខ្លួនទៅនឹងកិច្ចការជាច្រើនតាមរយៈការជំរុញ ការលៃតម្រូវ និងការទាញយកមកវិញ ( Bommasani et al., 2021 )
-
ស្រទាប់មូលដ្ឋានដែលផ្តល់ថាមពលដល់ផលិតផល AI បង្កើតថ្មីទំនើបបំផុត
ពួកវាមិនមែនជាស្ថាបត្យកម្ម ឬម៉ាកយីហោតែមួយនោះទេ។ ពួកវាជាប្រភេទគំរូដែលមានឥរិយាបទដូចជាវេទិកាមួយ។.
គំរូគ្រឹះមួយមិនដូចម៉ាស៊ីនគិតលេខទេ ប៉ុន្តែដូចជាផ្ទះបាយច្រើនជាង។ អ្នកអាចចម្អិនអាហារបានច្រើននៅក្នុងនោះ។ អ្នកក៏អាចដុតនំប៉័ងអាំងបានដែរ ប្រសិនបើអ្នកមិនយកចិត្តទុកដាក់… ប៉ុន្តែផ្ទះបាយនៅតែងាយស្រួលប្រើ 🍳🔥
១៤) សង្ខេប និងយកទៅអនុវត្ត ✅🙂
ម៉ូដែលគ្រឹះគឺជាម៉ាស៊ីនដែលអាចប្រើឡើងវិញបាននៃបញ្ញាសិប្បនិម្មិតបង្កើត។ ពួកវាត្រូវបានបណ្តុះបណ្តាលយ៉ាងទូលំទូលាយ បន្ទាប់មកសម្របខ្លួនទៅនឹងភារកិច្ចជាក់លាក់តាមរយៈការជំរុញ ការលៃតម្រូវ និងការទាញយកមកវិញ ( NIST , Stanford CRFM )។ ពួកវាអាចអស្ចារ្យ មិនស្អាត មានអានុភាព និងពេលខ្លះគួរឱ្យអស់សំណើច - ទាំងអស់ក្នុងពេលតែមួយ។
សង្ខេប៖
-
គំរូគ្រឹះ = គំរូមូលដ្ឋានសម្រាប់គោលបំណងទូទៅ ( NIST )
-
បញ្ញាសិប្បនិម្មិតបង្កើតថ្មី = ការបង្កើតខ្លឹមសារ មិនមែនគ្រាន់តែការចាត់ថ្នាក់ទេ ( ទម្រង់បញ្ញាសិប្បនិម្មិតបង្កើតថ្មី NIST )
-
វិធីសាស្ត្រសម្របខ្លួន (ការជំរុញ, RAG, ការលៃតម្រូវ) ធ្វើឱ្យវាអាចអនុវត្តបានជាក់ស្តែង ( Lewis et al., 2020 , Hu et al., 2021 )
-
ការជ្រើសរើសគំរូគឺនិយាយអំពីការសម្របសម្រួល៖ ភាពត្រឹមត្រូវ តម្លៃ ភាពយឺតយ៉ាវ ភាពឯកជន និងសុវត្ថិភាព ( NIST AI RMF 1.0 )
ប្រសិនបើអ្នកកំពុងសាងសង់អ្វីមួយដោយប្រើបច្ចេកវិទ្យា AI ដែលអាចបង្កើតបាន ការយល់ដឹងអំពីគំរូគ្រឹះមិនមែនជាជម្រើសទេ។ វាគឺជាជាន់ទាំងមូលដែលអគារនេះឈរនៅលើ... ហើយបាទ/ចាស៎ ពេលខ្លះជាន់នោះញ័របន្តិច 😅
សំណួរដែលសួរញឹកញាប់
គំរូគ្រឹះ និយាយឱ្យសាមញ្ញ
គំរូគ្រឹះគឺជាគំរូ AI ដ៏ធំមួយសម្រាប់គោលបំណងទូទៅ ដែលត្រូវបានបណ្តុះបណ្តាលលើទិន្នន័យទូលំទូលាយ ដូច្នេះវាអាចត្រូវបានប្រើឡើងវិញសម្រាប់កិច្ចការជាច្រើន។ ជំនួសឱ្យការកសាងគំរូមួយក្នុងមួយការងារ អ្នកចាប់ផ្តើមជាមួយគំរូ "មូលដ្ឋាន" ដ៏រឹងមាំមួយ ហើយសម្របវាតាមតម្រូវការ។ ការសម្របខ្លួននោះច្រើនតែកើតឡើងតាមរយៈការជំរុញ ការកែលម្អ ការទាញយកមកវិញ (RAG) ឬឧបករណ៍។ គំនិតកណ្តាលគឺភាពទូលំទូលាយបូកនឹងភាពអាចដឹកនាំបាន។.
របៀបដែលគំរូគ្រឹះខុសគ្នាពីគំរូ AI ជាក់លាក់សម្រាប់ភារកិច្ចប្រពៃណី
បញ្ញាសិប្បនិម្មិតបែបប្រពៃណីច្រើនតែបណ្តុះបណ្តាលគំរូដាច់ដោយឡែកមួយសម្រាប់កិច្ចការនីមួយៗ ដូចជាការវិភាគអារម្មណ៍ ឬការបកប្រែ។ គំរូមូលដ្ឋានបញ្ច្រាសគំរូនោះ៖ បណ្តុះបណ្តាលជាមុនម្តង បន្ទាប់មកប្រើប្រាស់ឡើងវិញនៅទូទាំងមុខងារ និងផលិតផលជាច្រើន។ នេះអាចកាត់បន្ថយការខិតខំប្រឹងប្រែងដដែលៗ និងបង្កើនល្បឿននៃការផ្តល់សមត្ថភាពថ្មីៗ។ ចំណុចវិជ្ជមានគឺថា ពួកវាអាចមិនអាចទស្សន៍ទាយបានជាងកម្មវិធីបុរាណទេ លុះត្រាតែអ្នកបន្ថែមការរឹតបន្តឹង និងការសាកល្បង។.
គំរូមូលដ្ឋាននៅក្នុង AI ដែលអាចបង្កើតបាន
នៅក្នុងបច្ចេកវិទ្យា AI ជំនាន់ថ្មី គំរូគ្រឹះគឺជាប្រព័ន្ធមូលដ្ឋានដែលអាចបង្កើតខ្លឹមសារថ្មីដូចជាអត្ថបទ រូបភាព អូឌីយ៉ូ កូដ ឬលទ្ធផលពហុម៉ូឌុល។ ពួកវាមិនត្រូវបានកំណត់ចំពោះការដាក់ស្លាក ឬការចាត់ថ្នាក់ទេ។ ពួកវាបង្កើតការឆ្លើយតបដែលស្រដៀងនឹងការងារដែលបង្កើតឡើងដោយមនុស្ស។ ដោយសារតែពួកវារៀនគំរូទូលំទូលាយក្នុងអំឡុងពេលបណ្តុះបណ្តាលជាមុន ពួកគេអាចដោះស្រាយប្រភេទ និងទម្រង់ប្រអប់បញ្ចូលជាច្រើន។ ពួកវាគឺជា "ស្រទាប់មូលដ្ឋាន" នៅពីក្រោយបទពិសោធន៍ជំនាន់ថ្មីភាគច្រើន។.
របៀបដែលគំរូគ្រឹះរៀនក្នុងអំឡុងពេលបណ្តុះបណ្តាលជាមុន
គំរូមូលដ្ឋានភាសាភាគច្រើនរៀនដោយការទស្សន៍ទាយសញ្ញាសម្គាល់ ដូចជាពាក្យបន្ទាប់ ឬពាក្យដែលបាត់នៅក្នុងអត្ថបទ។ គោលបំណងសាមញ្ញនោះជំរុញឱ្យពួកគេធ្វើសមាហរណកម្មរចនាសម្ព័ន្ធដូចជាវេយ្យាករណ៍ រចនាប័ទ្ម និងគំរូទូទៅនៃការពន្យល់។ ពួកគេក៏អាចស្រូបយកចំណេះដឹងពិភពលោកយ៉ាងច្រើនផងដែរ ទោះបីជាមិនតែងតែអាចទុកចិត្តបានក៏ដោយ។ លទ្ធផលគឺជាការតំណាងទូទៅដ៏រឹងមាំដែលអ្នកអាចដឹកនាំឆ្ពោះទៅរកការងារជាក់លាក់នៅពេលក្រោយ។.
ភាពខុសគ្នារវាងការជំរុញ ការលៃតម្រូវល្អិតល្អន់ LoRA និង RAG
ការជំរុញគឺជាមធ្យោបាយលឿនបំផុតដើម្បីដឹកនាំឥរិយាបថដោយប្រើការណែនាំ ប៉ុន្តែវាអាចផុយស្រួយ។ ការលៃតម្រូវល្អិតល្អន់បណ្តុះបណ្តាលគំរូបន្ថែមទៀតលើឧទាហរណ៍របស់អ្នកសម្រាប់ឥរិយាបថដែលស៊ីសង្វាក់គ្នាជាងមុន ប៉ុន្តែវាបន្ថែមថ្លៃដើម និងការថែទាំ។ LoRA/adapters គឺជាវិធីសាស្ត្រលៃតម្រូវល្អិតល្អន់ដែលស្រាលជាង ដែលជារឿយៗមានតម្លៃថោកជាង និងមានម៉ូឌុលច្រើនជាង។ RAG ទាញយកឯកសារពាក់ព័ន្ធ ហើយមានចម្លើយគំរូដោយប្រើបរិបទនោះ ដែលជួយដល់ភាពស្រស់ថ្លា និងមូលដ្ឋាន។.
ពេលណាត្រូវប្រើ RAG ជំនួសឱ្យការលៃតម្រូវល្អិតល្អន់
ជារឿយៗ RAG គឺជាជម្រើសដ៏រឹងមាំមួយនៅពេលដែលអ្នកត្រូវការចម្លើយដែលមានមូលដ្ឋានលើឯកសារបច្ចុប្បន្ន ឬមូលដ្ឋានចំណេះដឹងផ្ទៃក្នុងរបស់អ្នក។ វាអាចកាត់បន្ថយ "ការទាយ" ដោយផ្គត់ផ្គង់គំរូជាមួយនឹងបរិបទពាក់ព័ន្ធនៅពេលបង្កើត។ ការលៃតម្រូវដ៏ល្អិតល្អន់គឺសមស្របជាងនៅពេលដែលអ្នកត្រូវការរចនាប័ទ្មស្របគ្នា ឃ្លាដែន ឬឥរិយាបថដែលការជំរុញមិនអាចបង្កើតបានដោយភាពជឿជាក់។ ប្រព័ន្ធជាក់ស្តែងជាច្រើនរួមបញ្ចូលគ្នានូវការជំរុញ + RAG មុនពេលឈានដល់ការលៃតម្រូវដ៏ល្អិតល្អន់។.
របៀបកាត់បន្ថយការយល់ច្រឡំ និងទទួលបានចម្លើយដែលអាចទុកចិត្តបានជាងមុន
វិធីសាស្រ្តទូទៅមួយគឺត្រូវដាក់មូលដ្ឋានគ្រឹះលើគំរូជាមួយនឹងការទាញយក (RAG) ដើម្បីឱ្យវានៅជិតបរិបទដែលបានផ្តល់ឱ្យ។ អ្នកក៏អាចដាក់កម្រិតលទ្ធផលជាមួយគ្រោងការណ៍ តម្រូវឱ្យមានការហៅឧបករណ៍សម្រាប់ជំហានសំខាន់ៗ និងបន្ថែមការណែនាំ "កុំទាយ" ច្បាស់លាស់។ ស្រទាប់ផ្ទៀងផ្ទាត់ក៏សំខាន់ផងដែរ ដូចជាការត្រួតពិនិត្យច្បាប់ ការត្រួតពិនិត្យឆ្លង និងការពិនិត្យឡើងវិញដោយមនុស្សសម្រាប់ករណីប្រើប្រាស់ដែលមានហានិភ័យខ្ពស់។ ចាត់ទុកគំរូដូចជាជំនួយការប្រូបាប៊ីលីតេ មិនមែនជាប្រភពនៃសេចក្តីពិតតាមលំនាំដើមទេ។.
ហានិភ័យធំបំផុតជាមួយគំរូគ្រឹះក្នុងផលិតកម្ម
ហានិភ័យទូទៅរួមមាន ការយល់ច្រឡំ គំរូលំអៀង ឬគ្រោះថ្នាក់ពីទិន្នន័យបណ្តុះបណ្តាល និងការលេចធ្លាយភាពឯកជន ប្រសិនបើទិន្នន័យរសើបត្រូវបានដោះស្រាយមិនបានល្អ។ ប្រព័ន្ធក៏អាចងាយរងគ្រោះដោយសារការចាក់បញ្ចូលភ្លាមៗផងដែរ ជាពិសេសនៅពេលដែលគំរូអានអត្ថបទដែលមិនគួរឱ្យទុកចិត្តពីឯកសារ ឬខ្លឹមសារគេហទំព័រ។ ការកាត់បន្ថយជាធម្មតារួមមាន ការគ្រប់គ្រង ការដាក់ជាក្រុមក្រហម ការគ្រប់គ្រងការចូលប្រើ គំរូជំរុញដែលមានសុវត្ថិភាពជាងមុន និងការវាយតម្លៃដែលមានរចនាសម្ព័ន្ធ។ រៀបចំផែនការសម្រាប់ហានិភ័យទាំងនេះតាំងពីដំបូង ជាជាងការជួសជុលនៅពេលក្រោយ។.
ការចាក់បញ្ចូលភ្លាមៗ និងមូលហេតុដែលវាសំខាន់នៅក្នុងប្រព័ន្ធ RAG
ការចាក់បញ្ចូលភ្លាមៗ គឺជាពេលដែលអត្ថបទដែលមិនគួរឱ្យទុកចិត្តព្យាយាមជំនួសការណែនាំ ដូចជា "មិនអើពើនឹងការណែនាំមុនៗ" ឬ "បង្ហាញអាថ៌កំបាំង"។ នៅក្នុង RAG ឯកសារដែលទាញយកមកវិញអាចមានការណែនាំដែលមានគំនិតអាក្រក់ទាំងនោះ ហើយគំរូអាចធ្វើតាមពួកវា ប្រសិនបើអ្នកមិនប្រុងប្រយ័ត្ន។ វិធីសាស្រ្តទូទៅមួយគឺការញែកការណែនាំរបស់ប្រព័ន្ធ សម្អាតខ្លឹមសារដែលទាញយកមកវិញ និងពឹងផ្អែកលើគោលការណ៍ដែលមានមូលដ្ឋានលើឧបករណ៍ជាជាងការបញ្ចូលភ្លាមៗតែម្នាក់ឯង។ ការសាកល្បងជាមួយនឹងការបញ្ចូលផ្ទុយគ្នាជួយបង្ហាញពីចំណុចខ្សោយ។.
របៀបជ្រើសរើសម៉ូដែលគ្រឹះសម្រាប់ករណីប្រើប្រាស់របស់អ្នក
ចាប់ផ្តើមដោយកំណត់អ្វីដែលអ្នកត្រូវបង្កើត៖ អត្ថបទ រូបភាព អូឌីយ៉ូ កូដ ឬលទ្ធផលពហុម៉ូឌុល។ បន្ទាប់មកកំណត់របារការពិតរបស់អ្នក - ដែនដែលមានភាពត្រឹមត្រូវខ្ពស់ជារឿយៗត្រូវការការភ្ជាប់ដី (RAG) ការផ្ទៀងផ្ទាត់ និងជួនកាលការពិនិត្យឡើងវិញដោយមនុស្ស។ ពិចារណាពីភាពយឺតយ៉ាវ និងថ្លៃដើម ពីព្រោះគំរូដ៏រឹងមាំដែលយឺត ឬថ្លៃអាចពិបាកក្នុងការដឹកជញ្ជូន។ ជាចុងក្រោយ ភាពឯកជន និងការអនុលោមតាមផែនទីត្រូវការជម្រើសដាក់ពង្រាយ និងការគ្រប់គ្រង។.
ឯកសារយោង
-
វិទ្យាស្ថានជាតិស្តង់ដារ និងបច្ចេកវិទ្យា (NIST) - គំរូគ្រឹះ (ពាក្យសទ្ទានុក្រម) - csrc.nist.gov
-
វិទ្យាស្ថានជាតិស្តង់ដារ និងបច្ចេកវិទ្យា (NIST) - NIST AI 600-1៖ ទម្រង់ AI ដែលអាចបង្កើតបាន - nvlpubs.nist.gov
-
វិទ្យាស្ថានជាតិស្តង់ដារ និងបច្ចេកវិទ្យា (NIST) - NIST AI 100-1: ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យ AI (AI RMF 1.0) - nvlpubs.nist.gov
-
មជ្ឈមណ្ឌលស្រាវជ្រាវស្ទែនហ្វដលើគំរូគ្រឹះ (CRFM) - របាយការណ៍ - crfm.stanford.edu
-
arXiv - ស្តីពីឱកាស និងហានិភ័យនៃគំរូមូលនិធិ (Bommasani et al., 2021) - arxiv.org
-
arXiv - គំរូភាសាគឺជាអ្នករៀនដែលមានឱកាសតិចតួច (Brown et al., 2020) - arxiv.org
-
arXiv - ការបង្កើតដែលបានបង្កើនការទាញយកសម្រាប់កិច្ចការ NLP ដែលពឹងផ្អែកលើចំណេះដឹង (Lewis et al., 2020) - arxiv.org
-
arXiv - LoRA៖ ការសម្របខ្លួនកម្រិតទាបនៃគំរូភាសាធំៗ (Hu et al., 2021) - arxiv.org
-
arXiv - BERT៖ ការបណ្តុះបណ្តាលជាមុននៃឧបករណ៍បំលែងទ្វេទិសជ្រៅសម្រាប់ការយល់ដឹងភាសា (Devlin et al., 2018) - arxiv.org
-
arXiv - គំរូភាសាដែលបានកែសម្រួលគឺជាអ្នករៀនដែលមិនចាំបាច់ប្រើឧបករណ៍ (Wei et al., 2021) - arxiv.org
-
បណ្ណាល័យឌីជីថល ACM - ការស្ទង់មតិអំពីការយល់ច្រឡំក្នុងការបង្កើតភាសាធម្មជាតិ (Ji et al., 2023) - dl.acm.org
-
arXiv - ការរៀនគំរូដែលមើលឃើញដែលអាចផ្ទេរបានពីការត្រួតពិនិត្យភាសាធម្មជាតិ (Radford et al., 2021) - arxiv.org
-
arXiv - គំរូប្រូបាប៊ីលីតេនៃការសាយភាយសំឡេងរំខាន (Ho et al., 2020) - arxiv.org
-
arXiv - ការសំយោគរូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ជាមួយម៉ូដែលសាយភាយមិនទាន់ច្បាស់លាស់ (Rombach et al., 2021) - arxiv.org
-
arXiv - ការទាញយក Dense Passage សម្រាប់ការឆ្លើយសំណួរ Open-Domain (Karpukhin et al., 2020) - arxiv.org
-
arXiv - បណ្ណាល័យ Fais (Douze et al., 2024) - arxiv.org
-
OpenAI - ណែនាំអំពី Whisper - openai.com
-
arXiv - ការសំយោគ TTS ធម្មជាតិដោយការកំណត់លក្ខខណ្ឌ WaveNet លើការព្យាករណ៍វិសាលគម Mel (Shen et al., 2017) - arxiv.org
-
មជ្ឈមណ្ឌលសន្តិសុខ និងបច្ចេកវិទ្យាដែលកំពុងលេចចេញ (CSET) សាកលវិទ្យាល័យ Georgetown - អំណាចដ៏គួរឱ្យភ្ញាក់ផ្អើលនៃការទស្សន៍ទាយពាក្យបន្ទាប់៖ ការពន្យល់អំពីគំរូភាសាធំៗ (ផ្នែកទី 1) - cset.georgetown.edu
-
USENIX - ការស្រង់ទិន្នន័យបណ្តុះបណ្តាលពីគំរូភាសាធំៗ (Carlini et al., 2021) - usenix.org
-
OWASP - LLM01: ការចាក់បញ្ចូលភ្លាមៗ - genai.owasp.org
-
arXiv - ច្រើនជាងអ្វីដែលអ្នកបានស្នើសុំ៖ ការវិភាគដ៏ទូលំទូលាយអំពីការគំរាមកំហែងនៃការចាក់បញ្ចូលថ្មីចំពោះគំរូភាសាធំៗដែលរួមបញ្ចូលកម្មវិធី (Greshake et al., 2023) - arxiv.org
-
ស៊េរីសន្លឹកបន្លំ OWASP - សន្លឹកបន្លំការពារការចាក់បញ្ចូល LLM - cheatsheetseries.owasp.org