បញ្ញាសិប្បនិម្មិតប្រភពបើកចំហត្រូវបានគេនិយាយអំពីវាដូចជាវាជាកូនសោវេទមន្តដែលដោះសោអ្វីៗគ្រប់យ៉ាង។ វាមិនមែនជារឿងចម្លែកទេ។ ប៉ុន្តែវា គឺជា វិធីជាក់ស្តែង និងងាយស្រួលអនុញ្ញាតដើម្បីបង្កើតប្រព័ន្ធបញ្ញាសិប្បនិម្មិតដែលអ្នកអាចយល់ កែលម្អ និងដាក់ឱ្យដំណើរការដោយមិនចាំបាច់អង្វរអ្នកលក់ឱ្យប្តូរ។ ប្រសិនបើអ្នកឆ្ងល់ថាអ្វីដែលត្រូវបានចាត់ទុកថាជា "បើកចំហ" អ្វីដែលគ្រាន់តែជាការធ្វើទីផ្សារ និងរបៀបប្រើប្រាស់វានៅកន្លែងធ្វើការ អ្នកនៅកន្លែងត្រឹមត្រូវហើយ។ ផឹកកាហ្វេមួយកែវ - នេះនឹងមានប្រយោជន៍ ហើយប្រហែលជាមានមតិផ្ទាល់ខ្លួនបន្តិចបន្តួច ☕🙂។
អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖
🔗 របៀបបញ្ចូល AI ទៅក្នុងអាជីវកម្មរបស់អ្នក
ជំហានជាក់ស្តែងក្នុងការរួមបញ្ចូលឧបករណ៍ AI សម្រាប់កំណើនអាជីវកម្មដ៏ឆ្លាតវៃ។
🔗 របៀបប្រើ AI ឱ្យកាន់តែមានផលិតភាព
ស្វែងយល់ពីដំណើរការការងារ AI ដែលមានប្រសិទ្ធភាព ដែលចំណេញពេលវេលា និងបង្កើនប្រសិទ្ធភាព។
🔗 តើជំនាញ AI ជាអ្វី?
ស្វែងយល់ពីសមត្ថភាព AI សំខាន់ៗដែលចាំបាច់សម្រាប់អ្នកជំនាញដែលត្រៀមរួចជាស្រេចនាពេលអនាគត។
🔗 តើ Google Vertex AI ជាអ្វី?
ស្វែងយល់អំពី Vertex AI របស់ Google និងរបៀបដែលវាសម្រួលដល់ការរៀនម៉ាស៊ីន។
តើអ្វីទៅជា Open Source AI? 🤖🔓
នៅសាមញ្ញបំផុត Open Source AI មានន័យថាធាតុផ្សំនៃប្រព័ន្ធ AI - កូដ ទម្ងន់គំរូ បំពង់បង្ហូរទិន្នន័យ ស្គ្រីបបណ្តុះបណ្តាល និងឯកសារ - ត្រូវបានចេញផ្សាយក្រោមអាជ្ញាប័ណ្ណដែលអនុញ្ញាតឱ្យនរណាម្នាក់ប្រើ សិក្សា កែប្រែ និងចែករំលែកវា ស្របតាមលក្ខខណ្ឌសមហេតុផល។ ភាសាសេរីភាពស្នូលនោះបានមកពីនិយមន័យប្រភពបើកចំហ និងគោលការណ៍យូរអង្វែងរបស់វានៃសេរីភាពអ្នកប្រើប្រាស់ [1]។ ភាពច្របូកច្របល់ជាមួយ AI គឺថាមានធាតុផ្សំច្រើនជាងកូដ។
គម្រោងខ្លះបោះពុម្ពផ្សាយអ្វីៗគ្រប់យ៉ាង៖ កូដ ប្រភពទិន្នន័យបណ្តុះបណ្តាល រូបមន្តធ្វើម្ហូប និងគំរូដែលបានបណ្តុះបណ្តាល។ គម្រោងផ្សេងទៀតចេញផ្សាយតែ ទម្ងន់ ដែលមានអាជ្ញាប័ណ្ណផ្ទាល់ខ្លួនប៉ុណ្ណោះ។ ប្រព័ន្ធអេកូឡូស៊ីប្រើអក្សរកាត់មិនស្អាតពេលខ្លះ ដូច្នេះសូមយើងរៀបចំវាឡើងវិញនៅផ្នែកបន្ទាប់។
Open Source AI vs open weights vs open access 😅
នេះជាកន្លែងដែលមនុស្សនិយាយឆ្លងឆ្លើយគ្នា។
-
បញ្ញាសិប្បនិម្មិតប្រភពបើកចំហ — គម្រោងនេះអនុវត្តតាមគោលការណ៍ប្រភពបើកចំហនៅទូទាំងជង់របស់វា។ កូដស្ថិតនៅក្រោមអាជ្ញាប័ណ្ណដែលត្រូវបានអនុម័តដោយ OSI ហើយលក្ខខណ្ឌចែកចាយអនុញ្ញាតឱ្យមានការប្រើប្រាស់ ការកែប្រែ និងការចែករំលែកយ៉ាងទូលំទូលាយ។ ស្មារតីនៅទីនេះឆ្លុះបញ្ចាំងពីអ្វីដែល OSI ពិពណ៌នា៖ សេរីភាពរបស់អ្នកប្រើប្រាស់ជាអាទិភាព [1][2]។
-
ទម្ងន់បើកចំហ — ទម្ងន់គំរូដែលបានហ្វឹកហាត់អាចទាញយកបាន (ជារឿយៗឥតគិតថ្លៃ) ប៉ុន្តែស្ថិតនៅក្រោមលក្ខខណ្ឌតាមតម្រូវការ។ អ្នកនឹងឃើញលក្ខខណ្ឌនៃការប្រើប្រាស់ ដែនកំណត់នៃការចែកចាយឡើងវិញ ឬច្បាប់រាយការណ៍។ ក្រុមគ្រួសារ Llama របស់ Meta បង្ហាញចំណុចនេះ៖ ប្រព័ន្ធអេកូឡូស៊ីកូដគឺបើកចំហ ប៉ុន្តែទម្ងន់គំរូត្រូវបានដឹកជញ្ជូនក្រោមអាជ្ញាប័ណ្ណជាក់លាក់ជាមួយនឹងលក្ខខណ្ឌផ្អែកលើការប្រើប្រាស់ [4]។
-
ការចូលប្រើដោយបើកចំហ — អ្នកអាចចូលប្រើ API ប្រហែលជាឥតគិតថ្លៃ ប៉ុន្តែអ្នកមិនទទួលបានទម្ងន់ទេ។ មានប្រយោជន៍សម្រាប់ការពិសោធន៍ ប៉ុន្តែមិនមែនជាប្រភពបើកចំហទេ។
នេះមិនមែនគ្រាន់តែជាអត្ថន័យ។ សិទ្ធិ និងហានិភ័យរបស់អ្នកផ្លាស់ប្តូរតាមប្រភេទទាំងនេះ។ ការងារបច្ចុប្បន្នរបស់ OSI លើ AI និងភាពបើកចំហរស្រាយនូវភាពខុសប្លែកគ្នាទាំងនេះជាភាសាសាមញ្ញ [2] ។
អ្វីដែលធ្វើឱ្យ Open Source AI ពិតជាល្អ ✅
ចូរយើងរហ័សនិងស្មោះត្រង់។
-
លទ្ធភាពធ្វើសវនកម្ម — អ្នកអាចអានកូដ ត្រួតពិនិត្យរូបមន្តទិន្នន័យ និងតាមដានជំហានបណ្តុះបណ្តាល។ វាជួយជាមួយនឹងការអនុលោមតាមច្បាប់ ការពិនិត្យសុវត្ថិភាព និងការចង់ដឹងចង់ឃើញបែបបុរាណ។ ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យ AI របស់ NIST លើកទឹកចិត្តដល់ការអនុវត្តឯកសារ និងតម្លាភាពដែលគម្រោងបើកចំហអាចបំពេញបានយ៉ាងងាយស្រួល [3]។
-
ភាពបត់បែន — អ្នកមិនត្រូវបានចងភ្ជាប់ទៅនឹងផែនទីបង្ហាញផ្លូវរបស់អ្នកលក់ទេ។ បំបែកវា។ បិទវា។ ដឹកជញ្ជូនវា។ Lego មិនមែនផ្លាស្ទិចស្អិតទេ។
-
ការគ្រប់គ្រងថ្លៃដើម — បង្ហោះដោយខ្លួនឯងនៅពេលដែលវាមានតម្លៃថោកជាង។ ផ្ទុះឡើងទៅជាពពកនៅពេលដែលវាមានតម្លៃថោកជាង។ លាយបញ្ចូលគ្នានូវផ្នែករឹង។
-
ល្បឿនសហគមន៍ — កំហុសត្រូវបានជួសជុល បង្កើតដី ហើយអ្នករៀនពីមិត្តភក្ដិ។ រញ៉េរញ៉ៃ? ពេលខ្លះ។ មានផលិតភាព? ជាញឹកញាប់។
-
ភាពច្បាស់លាស់នៃអភិបាលកិច្ច — អាជ្ញាប័ណ្ណបើកចំហពិតប្រាកដអាចទស្សន៍ទាយបាន។ ប្រៀបធៀបវាជាមួយលក្ខខណ្ឌនៃសេវាកម្ម API ដែលផ្លាស់ប្តូរស្ងាត់ៗនៅថ្ងៃអង្គារ។
តើវាល្អឥតខ្ចោះទេ? ទេ ប៉ុន្តែការដោះដូរគឺអាចយល់បាន - ច្រើនជាងអ្នកទទួលបានពីសេវាកម្មប្រអប់ខ្មៅជាច្រើន។
ជង់ AI ប្រភពបើកចំហ៖ កូដ ទម្ងន់ ទិន្នន័យ និងកាវ🧩
គិតពីគម្រោង AI ដូចជាឡាសាណាដែលប្លែក។ ស្រទាប់នៅគ្រប់ទីកន្លែង។
-
ក្របខ័ណ្ឌ និងពេលវេលាដំណើរការ — ឧបករណ៍ដើម្បីកំណត់ បណ្តុះបណ្តាល និងបម្រើគំរូ (ឧទាហរណ៍ PyTorch, TensorFlow)។ សហគមន៍ និងឯកសារដែលមានសុខភាពល្អមានសារៈសំខាន់ជាងឈ្មោះម៉ាក។
-
ស្ថាបត្យកម្មគំរូ — គំនូរព្រាង៖ ឧបករណ៍បំលែង គំរូសាយភាយ ការរៀបចំដែលបង្កើនការទាញយកមកវិញ។
-
ទម្ងន់ — ប៉ារ៉ាម៉ែត្រដែលបានរៀនក្នុងអំឡុងពេលបណ្តុះបណ្តាល។ “បើកចំហ” នៅទីនេះអាស្រ័យលើសិទ្ធិចែកចាយឡើងវិញ និងសិទ្ធិប្រើប្រាស់ពាណិជ្ជកម្ម មិនមែនគ្រាន់តែលទ្ធភាពទាញយកនោះទេ។
-
ទិន្នន័យ និងរូបមន្តធ្វើម្ហូប — ស្គ្រីបរៀបចំ តម្រង ការបន្ថែម កាលវិភាគបណ្តុះបណ្តាល។ តម្លាភាពនៅទីនេះគឺជាមាសសម្រាប់ភាពអាចបង្កើតឡើងវិញបាន។
-
ឧបករណ៍ និងការរៀបចំ — ម៉ាស៊ីនបម្រើការសន្និដ្ឋាន មូលដ្ឋានទិន្នន័យវ៉ិចទ័រ ឧបករណ៍វាយតម្លៃ សមត្ថភាពសង្កេត CI/CD។
-
ការផ្តល់អាជ្ញាប័ណ្ណ — ឆ្អឹងខ្នងដ៏ស្ងប់ស្ងាត់ដែលសម្រេចលើអ្វីដែលអ្នកពិតជាអាចធ្វើបាន។ មានព័ត៌មានបន្ថែមនៅខាងក្រោម។
អាជ្ញាប័ណ្ណ 101 សម្រាប់ Open Source AI 📜
អ្នកមិនចាំបាច់ធ្វើជាមេធាវីទេ។ អ្នកត្រូវកំណត់លំនាំ។
-
អាជ្ញាប័ណ្ណកូដដែលមានការអនុញ្ញាត — MIT, BSD, Apache-2.0។ Apache រួមបញ្ចូលការផ្តល់សិទ្ធិប៉ាតង់ជាក់លាក់មួយ ដែលក្រុមជាច្រើនពេញចិត្ត [1]។
-
កម្មសិទ្ធិបញ្ញា — គ្រួសារ GPL តម្រូវឱ្យដេរីវេនៅតែបើកចំហក្រោមអាជ្ញាប័ណ្ណដូចគ្នា។ មានឥទ្ធិពលខ្លាំង ប៉ុន្តែត្រូវរៀបចំផែនការសម្រាប់វានៅក្នុងស្ថាបត្យកម្មរបស់អ្នក។
-
អាជ្ញាប័ណ្ណជាក់លាក់តាមម៉ូដែល — សម្រាប់ទម្ងន់ និងសំណុំទិន្នន័យ អ្នកនឹងឃើញអាជ្ញាប័ណ្ណផ្ទាល់ខ្លួនដូចជាគ្រួសារអាជ្ញាប័ណ្ណ AI ដែលមានទំនួលខុសត្រូវ (OpenRAIL)។ ទាំងនេះអ៊ិនកូដការអនុញ្ញាត និងការរឹតបន្តឹងផ្អែកលើការប្រើប្រាស់។ ខ្លះអនុញ្ញាតឱ្យប្រើប្រាស់សម្រាប់ពាណិជ្ជកម្មយ៉ាងទូលំទូលាយ ខ្លះទៀតបន្ថែមរបាំងការពារជុំវិញការប្រើប្រាស់ខុស [5]។
-
Creative Commons សម្រាប់ទិន្នន័យ — CC-BY ឬ CC0 គឺជារឿងធម្មតាសម្រាប់សំណុំទិន្នន័យ និងឯកសារ។ ការបញ្ជាក់អត្តសញ្ញាណអាចគ្រប់គ្រងបានក្នុងទ្រង់ទ្រាយតូច។ បង្កើតគំរូតាំងពីដំបូង។
ព័ត៌មានជំនួយ៖ រក្សាបញ្ជីទំព័រតែមួយដែលរាយបញ្ជីភាពអាស្រ័យនីមួយៗ អាជ្ញាប័ណ្ណរបស់វា និងថាតើការចែកចាយឡើងវិញពាណិជ្ជកម្មត្រូវបានអនុញ្ញាត។ ធុញ? បាទ។ ចាំបាច់? បាទ។
តារាងប្រៀបធៀប៖ គម្រោង AI ប្រភពបើកចំហដ៏ពេញនិយម និងកន្លែងដែលពួកគេបញ្ចេញពន្លឺ📊
រញ៉េរញ៉ៃបន្តិចបន្តួចតាមគោលបំណង - នោះហើយជារបៀបដែលកំណត់ត្រាពិតប្រាកដមើលទៅ
| ឧបករណ៍ / គម្រោង | តើវាសម្រាប់អ្នកណា | តម្លៃ | ហេតុអ្វីបានជាវាដំណើរការបានល្អ |
|---|---|---|---|
| PyTorch | អ្នកស្រាវជ្រាវ, វិស្វករ | ឥតគិតថ្លៃ | ក្រាហ្វថាមវន្ត សហគមន៍ដ៏ធំ ឯកសាររឹងមាំ។ សមរភូមិ-សាកល្បងនៅក្នុងផលិតផល។ |
| TensorFlow | ក្រុមសហគ្រាស, ML ops | ឥតគិតថ្លៃ | របៀបក្រាហ្វ, TF-Serving, ជម្រៅប្រព័ន្ធអេកូ។ ការរៀនសូត្រកាន់តែរឹងមាំសម្រាប់អ្នកខ្លះ។ |
| អ្នកប្រែរូបមុខឱប | អ្នកសាងសង់ដែលមានកាលកំណត់ | ឥតគិតថ្លៃ | គំរូដែលបានហ្វឹកហាត់ជាមុន បំពង់បង្ហូរ សំណុំទិន្នន័យ ការលៃតម្រូវងាយស្រួល។ ត្រង់ផ្លូវកាត់។ |
| vLLM | ក្រុមដែលមានគំនិតអ៊ីនហ្វ្រារ៉េដ | ឥតគិតថ្លៃ | ការបម្រើ LLM លឿន ឃ្លាំងសម្ងាត់ KV ប្រកបដោយប្រសិទ្ធភាព ដំណើរការខ្លាំងនៅលើ GPU ទូទៅ។ |
| Llama.cpp | Tinkerers ឧបករណ៍គែម | ឥតគិតថ្លៃ | ដំណើរការម៉ូដែលក្នុងស្រុកនៅលើកុំព្យូទ័រយួរដៃ និងទូរស័ព្ទជាមួយនឹងការធ្វើបរិមាណ។ |
| ឡាងឆាយន | កម្មវិធី devs, គំរូដើម | ឥតគិតថ្លៃ | ខ្សែសង្វាក់ដែលអាចផ្សំបាន ឧបករណ៍ភ្ជាប់ ភ្នាក់ងារ។ ឈ្នះរហ័ស ប្រសិនបើអ្នករក្សាវាឱ្យសាមញ្ញ។ |
| ការសាយភាយមានស្ថេរភាព | ការច្នៃប្រឌិត ក្រុមផលិតផល | ទម្ងន់ឥតគិតថ្លៃ | ការបង្កើតរូបភាពក្នុងតំបន់ឬពពក; លំហូរការងារដ៏ធំ និង UI នៅជុំវិញវា។ |
| អូឡាម៉ា | អ្នកអភិវឌ្ឍន៍ដែលស្រឡាញ់ CLIs ក្នុងស្រុក | ឥតគិតថ្លៃ | ទាញ និងដំណើរការម៉ូដែលក្នុងស្រុក។ អាជ្ញាប័ណ្ណខុសគ្នាតាមកាតគំរូ—មើលវា។ |
បាទ "ឥតគិតថ្លៃ" ជាច្រើន។ ការបង្ហោះ GPUs កន្លែងផ្ទុក និងម៉ោងមនុស្សគឺមិនគិតថ្លៃទេ។
របៀបដែលក្រុមហ៊ុនពិតជាប្រើប្រាស់ Open Source AI នៅកន្លែងធ្វើការ 🏢⚙️
អ្នកនឹងឮពីរយ៉ាង៖ ទាំងអ្នករាល់គ្នាគួរធ្វើជាម្ចាស់ផ្ទះគ្រប់យ៉ាងដោយខ្លួនឯង ឬក៏គ្មានអ្នកណាគួរដែរ។ ជីវិតពិតគឺ squishier ។
-
ការបង្កើតគំរូដើមយ៉ាងរហ័ស — ចាប់ផ្តើមជាមួយនឹងគំរូបើកចំហដែលអនុញ្ញាត ដើម្បីផ្ទៀងផ្ទាត់ UX និងផលប៉ះពាល់។ ធ្វើការកែតម្រូវឡើងវិញនៅពេលក្រោយ។
-
ការបម្រើសេវាកម្មចម្រុះ — រក្សាគំរូដែលបង្ហោះដោយ VPC ឬនៅនឹងកន្លែងសម្រាប់ការហៅទូរសព្ទដែលងាយរងគ្រោះដោយភាពឯកជន។ ត្រឡប់ទៅប្រើ API ដែលបង្ហោះវិញសម្រាប់បន្ទុកវែង ឬបន្ទុកមុតស្រួច។ ធម្មតាណាស់។
-
ការលៃតម្រូវសម្រាប់កិច្ចការតូចចង្អៀត — ការសម្របខ្លួនតាមដែនជារឿយៗលើសពីមាត្រដ្ឋានឆៅ។
-
RAG នៅគ្រប់ទីកន្លែង — ការបង្កើតឡើងវិញដែលបង្កើនប្រសិទ្ធភាពកាត់បន្ថយការយល់ច្រឡំដោយការផ្តល់ចម្លើយជាមូលដ្ឋាននៅក្នុងទិន្នន័យរបស់អ្នក។ មូលដ្ឋានទិន្នន័យវ៉ិចទ័របើកចំហ និងអាដាប់ទ័រធ្វើឱ្យរឿងនេះងាយស្រួលទាក់ទង។
-
Edge និងក្រៅបណ្តាញ — ម៉ូដែលទម្ងន់ស្រាលដែលចងក្រងឡើងសម្រាប់កុំព្យូទ័រយួរដៃ ទូរស័ព្ទ ឬកម្មវិធីរុករកពង្រីកផ្ទៃផលិតផល។
-
ការអនុលោមតាមច្បាប់ និងការធ្វើសវនកម្ម — ដោយសារតែអ្នកអាចត្រួតពិនិត្យភាពវៃឆ្លាត អ្នកសវនករមានអ្វីមួយជាក់លាក់ដើម្បីពិនិត្យ។ ផ្គូផ្គងវាជាមួយនឹងគោលនយោបាយ AI ដ៏មានទំនួលខុសត្រូវ ដែលផ្គូផ្គងទៅនឹងប្រភេទ RMF របស់ NIST និងការណែនាំឯកសារ [3]។
កំណត់ចំណាំតូចមួយ៖ ក្រុម SaaS ដែលគិតគូរពីភាពឯកជនដែលខ្ញុំបានឃើញ (អ្នកប្រើប្រាស់ទីផ្សារមធ្យម និងសហភាពអឺរ៉ុប) បានអនុម័តការរៀបចំកូនកាត់៖ គំរូបើកចំហតូចមួយនៅក្នុង VPC សម្រាប់ 80% នៃសំណើ; ផ្ទុះឡើងទៅកាន់ API ដែលបានបង្ហោះសម្រាប់ការជំរុញបរិបទវែង និងកម្រ។ ពួកគេបានកាត់បន្ថយភាពយឺតយ៉ាវសម្រាប់ផ្លូវទូទៅ និងធ្វើឱ្យឯកសារ DPIA សាមញ្ញ - ដោយមិនចាំបាច់ដាំទឹកពុះ។
ហានិភ័យ និង gotchas ដែលអ្នកគួរតែរៀបចំផែនការសម្រាប់🧨
ចូរយើងក្លាយជាមនុស្សពេញវ័យអំពីរឿងនេះ។
-
ការរសាត់បាត់អាជ្ញាប័ណ្ណ — ឃ្លាំងទិន្នន័យចាប់ផ្តើម MIT បន្ទាប់មកទម្ងន់ផ្លាស់ទីទៅអាជ្ញាប័ណ្ណផ្ទាល់ខ្លួន។ រក្សាការចុះបញ្ជីផ្ទៃក្នុងរបស់អ្នកឱ្យទាន់សម័យ ឬអ្នកនឹងផ្ញើការភ្ញាក់ផ្អើលអំពីការអនុលោមតាមច្បាប់ [2][4][5]។
-
ប្រភពទិន្នន័យ — ទិន្នន័យបណ្តុះបណ្តាលដែលមានសិទ្ធិមិនច្បាស់លាស់អាចហូរចូលទៅក្នុងគំរូ។ តាមដានប្រភព និងអនុវត្តតាមអាជ្ញាប័ណ្ណសំណុំទិន្នន័យ មិនមែន vibes [5] ទេ។
-
សុវត្ថិភាព — ចាត់ទុកវត្ថុបុរាណគំរូដូចខ្សែសង្វាក់ផ្គត់ផ្គង់ផ្សេងទៀតដែរ៖ checksums, signed releases, SBOMs។ សូម្បីតែ SECURITY.md តិចតួចបំផុតក៏អាចយកឈ្នះភាពស្ងៀមស្ងាត់បានដែរ។
-
ភាពខុសគ្នានៃគុណភាព — គំរូបើកចំហមានភាពខុសគ្នាយ៉ាងទូលំទូលាយ។ វាយតម្លៃជាមួយភារកិច្ចរបស់អ្នក មិនមែនគ្រាន់តែតារាងពិន្ទុនោះទេ។
-
ថ្លៃដើមហេដ្ឋារចនាសម្ព័ន្ធដែលលាក់កំបាំង — ការសន្និដ្ឋានរហ័សត្រូវការ GPU ការធ្វើបរិមាណ ការចាត់ថ្នាក់ និងការរក្សាទុកទិន្នន័យក្នុងឃ្លាំងសម្ងាត់។ ឧបករណ៍បើកចំហជួយបាន; អ្នកនៅតែបង់ប្រាក់ក្នុងការគណនា។
-
បំណុលអភិបាលកិច្ច — ប្រសិនបើគ្មាននរណាម្នាក់ជាម្ចាស់វដ្តជីវិតរបស់គំរូទេ អ្នកនឹងទទួលបានស្ប៉ាហ្គេទីកំណត់រចនាសម្ព័ន្ធ។ បញ្ជីត្រួតពិនិត្យ MLOps ទម្ងន់ស្រាលគឺជាមាស។
ការជ្រើសរើសកម្រិតបើកចំហរត្រឹមត្រូវសម្រាប់ករណីប្រើប្រាស់របស់អ្នក🧭
ផ្លូវសម្រេចចិត្តខុសបន្តិច៖
-
ត្រូវការ ការដឹកជញ្ជូនលឿន ជាមួយនឹងតម្រូវការអនុលោមតាមពន្លឺ? ចាប់ផ្តើមជាមួយនឹងម៉ូដែលបើកចំហដែលមានការអនុញ្ញាត ការលៃតម្រូវតិចតួច ការបម្រើលើពពក។
-
ត្រូវការ ភាពឯកជនដ៏តឹងរឹង ឬ ប្រតិបត្តិការជ្រើសរើសជង់បើកចំហដែលគាំទ្រយ៉ាងល្អ ការសន្និដ្ឋានដោយខ្លួនឯង និងពិនិត្យអាជ្ញាប័ណ្ណដោយប្រុងប្រយ័ត្ន។ ក្រៅបណ្តាញ ?
-
ត្រូវការ សិទ្ធិពាណិជ្ជកម្មទូលំទូលាយ និងការចែកចាយឡើងវិញទេ? ចូលចិត្តកូដដែលបានតម្រឹម OSI បូកនឹងអាជ្ញាប័ណ្ណគំរូដែលអនុញ្ញាតយ៉ាងច្បាស់ក្នុងការប្រើប្រាស់ពាណិជ្ជកម្ម និងការចែកចាយឡើងវិញ [1][5] ។
-
ត្រូវការ ភាពបត់បែននៃការស្រាវជ្រាវ? បន្តការអនុញ្ញាតពីចុងដល់ចប់ រួមទាំងទិន្នន័យ សម្រាប់ការផលិតឡើងវិញ និងលទ្ធភាពចែករំលែក។
-
មិនប្រាកដទេ? អ្នកបើកយន្តហោះទាំងពីរ។ ផ្លូវមួយនឹងមានអារម្មណ៍ប្រសើរជាងមុនក្នុងមួយសប្តាហ៍។
របៀបវាយតម្លៃគម្រោង Open Source AI ដូចអ្នកជំនាញ🔍
បញ្ជីពិនិត្យរហ័សដែលខ្ញុំរក្សាទុក ជួនកាលនៅលើកន្សែង។
-
ភាពច្បាស់លាស់នៃអាជ្ញាប័ណ្ណ — មានការអនុម័តដោយ OSI សម្រាប់កូដ? ចុះទម្ងន់ និងទិន្នន័យវិញ? តើមានការដាក់កំហិតការប្រើប្រាស់ណាមួយដែលធ្វើឲ្យខូចគំរូអាជីវកម្មរបស់អ្នក [1][2][5] ដែរឬទេ?
-
ឯកសារ — ដំឡើង ការចាប់ផ្តើមរហ័ស ឧទាហរណ៍ ការដោះស្រាយបញ្ហា។ ឯកសារគឺជាសញ្ញាវប្បធម៌។
-
ចង្វាក់នៃការចេញផ្សាយ — ការចេញផ្សាយ និងកំណត់ហេតុផ្លាស់ប្ដូរដែលមានស្លាកបង្ហាញពីស្ថេរភាព។ ការជំរុញម្តងម្កាលបង្ហាញពីវីរភាព។
-
ស្តង់ដារ និងការវាយតម្លៃ — ភារកិច្ចមានភាពប្រាកដនិយម? ការវាយតម្លៃអាចដំណើរការបាន?
-
ការថែទាំ និងអភិបាលកិច្ច — ម្ចាស់កូដច្បាស់លាស់ ការបែងចែកបញ្ហា ការឆ្លើយតបរបស់ PR។
-
ភាពសមស្របនៃប្រព័ន្ធអេកូឡូស៊ី — ដំណើរការបានល្អជាមួយផ្នែករឹង ការផ្ទុកទិន្នន័យ ការកត់ត្រា និងការអនុញ្ញាតរបស់អ្នក។
-
ឥរិយាបថសុវត្ថិភាព — វត្ថុបុរាណដែលបានចុះហត្ថលេខា ការស្កេនភាពអាស្រ័យ ការដោះស្រាយ CVE។
-
សញ្ញាសហគមន៍ — ការពិភាក្សា ចម្លើយលើវេទិកា ឧទាហរណ៍នៃឃ្លាំងផ្ទុកទិន្នន័យ។
សម្រាប់ការតម្រឹមកាន់តែទូលំទូលាយជាមួយការអនុវត្តដែលគួរឱ្យទុកចិត្ត សូមគូសផែនទីដំណើរការរបស់អ្នកទៅប្រភេទ NIST AI RMF និងវត្ថុបុរាណនៃឯកសារ [3] ។
ការជ្រមុជទឹកជ្រៅ 1: ពាក់កណ្តាលដ៏រញ៉េរញ៉ៃនៃអាជ្ញាប័ណ្ណគំរូ🧪
ម៉ូដែលដែលមានសមត្ថភាពបំផុតមួយចំនួនស្ថិតនៅក្នុងធុង "ទម្ងន់បើកចំហជាមួយលក្ខខណ្ឌ"។ ពួកវាអាចចូលប្រើបាន ប៉ុន្តែមានដែនកំណត់ការប្រើប្រាស់ ឬច្បាប់ចែកចាយឡើងវិញ។ នោះអាចល្អប្រសិនបើផលិតផលរបស់អ្នកមិនអាស្រ័យលើការវេចខ្ចប់ម៉ូដែលឡើងវិញ ឬការដឹកជញ្ជូនវាទៅក្នុងបរិយាកាសអតិថិជន។ ប្រសិនបើអ្នក ពិតជា ត្រូវការវា សូមចរចា ឬជ្រើសរើសមូលដ្ឋានផ្សេង។ ចំណុចសំខាន់គឺត្រូវផ្គូផ្គង របស់អ្នក ទល់នឹង ពិតប្រាកដ មិនមែនប្រកាសប្លក់ទេ [4][5]។
អាជ្ញាប័ណ្ណរចនាប័ទ្ម OpenRAIL ព្យាយាមធ្វើឱ្យមានតុល្យភាព៖ លើកទឹកចិត្តឱ្យមានការស្រាវជ្រាវបើកចំហ និងការចែករំលែក ខណៈពេលដែលរារាំងការប្រើប្រាស់ខុស។ ចេតនាគឺល្អ; កាតព្វកិច្ចនៅតែជារបស់អ្នក។ អានលក្ខខណ្ឌ ហើយសម្រេចចិត្តថាតើលក្ខខណ្ឌសមនឹងចំណង់ហានិភ័យរបស់អ្នកដែរឬទេ [5] ។
ការជ្រមុជទឹកជ្រៅ 2៖ តម្លាភាពទិន្នន័យ និងទេវកថានៃការផលិតឡើងវិញ🧬
«បើគ្មានការបោះចោលទិន្នន័យពេញលេញទេ បញ្ញាសិប្បនិម្មិតប្រភពបើកចំហគឺជាក្លែងក្លាយ»។ មិនមែនទាំងស្រុងទេ។ ប្រភព និង រូបមន្តធ្វើម្ហូប អាចផ្តល់នូវតម្លាភាពដែលមានអត្ថន័យ ទោះបីជាសំណុំទិន្នន័យឆៅមួយចំនួនត្រូវបានកំណត់ក៏ដោយ។ អ្នកអាចកត់ត្រាតម្រង សមាមាត្រគំរូ និងការសម្អាតការវិភាគបានល្អគ្រប់គ្រាន់សម្រាប់ក្រុមមួយផ្សេងទៀតដើម្បីប៉ាន់ស្មានលទ្ធផល។ ការផលិតឡើងវិញដ៏ល្អឥតខ្ចោះគឺល្អ។ តម្លាភាពដែលអាចអនុវត្តបានជារឿយៗគ្រប់គ្រាន់ [3][5]។
នៅពេលដែលសំណុំទិន្នន័យត្រូវបានបើក រសជាតិ Creative Commons ដូចជា CC-BY ឬ CC0 គឺជារឿងធម្មតា។ ការបញ្ជាក់តាមមាត្រដ្ឋានអាចមានភាពឆ្គាំឆ្គង ដូច្នេះសូមកំណត់ស្តង់ដារពីរបៀបដែលអ្នកដោះស្រាយវាឱ្យបានឆាប់។
ការជ្រមុជទឹកជ្រៅ 3: MLOps ជាក់ស្តែងសម្រាប់ម៉ូដែលបើកចំហ🚢
ការដឹកជញ្ជូនគំរូបើកចំហគឺដូចជាការដឹកជញ្ជូនសេវាកម្មណាមួយ បូករួមទាំងការទាក់ទាញមួយចំនួន។
-
ស្រទាប់បម្រើ — ម៉ាស៊ីនមេសន្និដ្ឋានឯកទេសបង្កើនប្រសិទ្ធភាពការចាត់ថ្នាក់ជាបាច់ ការគ្រប់គ្រងឃ្លាំងសម្ងាត់ KV និងការផ្សាយសញ្ញាសម្ងាត់។
-
បរិមាណនីយកម្ម — ទម្ងន់តូចជាង → ការសន្និដ្ឋានថោកជាង និងការដាក់ពង្រាយគែមកាន់តែងាយស្រួល។ ការសម្របសម្រួលគុណភាពគឺខុសគ្នា; វាស់វែងជាមួយ ភារកិច្ច របស់អ្នក ។
-
ភាពអាចសង្កេតបាន — កត់ត្រាការណែនាំ/លទ្ធផលដោយគិតគូរពីភាពឯកជន។ គំរូសម្រាប់វាយតម្លៃ។ បន្ថែមការត្រួតពិនិត្យការរសាត់ដូចដែលអ្នកធ្វើសម្រាប់ ML បែបប្រពៃណី។
-
ការអាប់ដេត — ម៉ូដែលអាចផ្លាស់ប្តូរឥរិយាបថដោយប្រយោល; ប្រើសត្វចាប និងរក្សាបណ្ណសារសម្រាប់ការរំកិលថយក្រោយ និងការធ្វើសវនកម្ម។
-
ការវាយតម្លៃ — រក្សាសំណុំការវាយតម្លៃជាក់លាក់សម្រាប់ភារកិច្ច មិនមែនគ្រាន់តែជាស្តង់ដារទូទៅនោះទេ។ រួមបញ្ចូលទាំងការជំរុញប្រឆាំង និងថវិកាពន្យារពេល។
ប្លង់តូច៖ ពីសូន្យទៅអ្នកបើកយន្តហោះដែលអាចប្រើបានក្នុង 10 ជំហាន🗺️
-
កំណត់កិច្ចការតូចចង្អៀតមួយ និងម៉ែត្រ។ មិនមានវេទិកាដ៏អស្ចារ្យនៅឡើយទេ។
-
ជ្រើសរើសគំរូមូលដ្ឋានដែលមានការអនុញ្ញាត ដែលត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយ និងមានឯកសារយ៉ាងល្អ។
-
ក្រោកឈរឡើងការសន្និដ្ឋានក្នុងស្រុក និង API រុំស្តើង។ ទុកវាឱ្យធុញ។
-
បន្ថែមការទាញយកទៅលទ្ធផលមូលដ្ឋានលើទិន្នន័យរបស់អ្នក។
-
រៀបចំសំណុំវាយតម្លៃដែលមានស្លាកតូចមួយដែលឆ្លុះបញ្ចាំងពីអ្នកប្រើប្រាស់របស់អ្នក ឬស និងទាំងអស់។
-
បទភ្លេងល្អ ឬប្រណិតបានលុះត្រាតែការវាយតម្លៃប្រាប់ថាអ្នកគួរ។
-
គណនាបរិមាណប្រសិនបើភាពយឺតយ៉ាវ ឬតម្លៃខាំ។ វាស់គុណភាពឡើងវិញ។
-
បន្ថែមការកត់ត្រា ការជម្រុញក្រុមក្រហម និងគោលការណ៍បំពាន។
-
ច្រកទ្វារដែលមានទង់មុខងារ ហើយបញ្ចេញទៅក្រុមតូចមួយ។
-
ធ្វើម្តងទៀត។ ដឹកជញ្ជូនការកែលម្អតិចតួចរៀងរាល់សប្តាហ៍... ឬនៅពេលដែលវាប្រសើរជាងពិតប្រាកដ។
ទេវកថាទូទៅអំពី Open Source AI បានបង្ហាញចេញបន្តិច🧱
-
ទេវកថា: ម៉ូដែលបើកចំហគឺតែងតែអាក្រក់។ ការពិត៖ សម្រាប់កិច្ចការដែលបានកំណត់គោលដៅជាមួយនឹងទិន្នន័យត្រឹមត្រូវ ម៉ូដែលបើកចំហដែលបានកែតម្រូវអាចដំណើរការបានច្រើនជាងការបង្ហោះធំជាង។
-
ទេវកថា៖ បើកចំហមានន័យថាគ្មានសុវត្ថិភាព។ ការពិត៖ ភាពបើកចំហអាចកែលម្អការពិនិត្យមើល។ សុវត្ថិភាពអាស្រ័យលើការអនុវត្តមិនមែនជាការសម្ងាត់ [3] ។
-
ទេវកថា៖ អាជ្ញាប័ណ្ណមិនមានបញ្ហាទេប្រសិនបើវាឥតគិតថ្លៃ។ ការពិត៖ វាសំខាន់ បំផុត នៅពេលដែលវាឥតគិតថ្លៃ ពីព្រោះការឥតគិតថ្លៃធ្វើឱ្យការប្រើប្រាស់មានមាត្រដ្ឋាន។ អ្នកចង់បានសិទ្ធិជាក់លាក់ មិនមែនភាពរំជើបរំជួលទេ [1][5]។
ប្រភពបើកចំហ AI 🧠✨
Open Source AI មិនមែនជាសាសនាទេ។ វាជាសំណុំនៃសេរីភាពជាក់ស្តែង ដែលអនុញ្ញាតឱ្យអ្នកបង្កើតជាមួយនឹងការគ្រប់គ្រងកាន់តែច្រើន អភិបាលកិច្ចកាន់តែច្បាស់ និងការធ្វើម្តងទៀតលឿនជាងមុន។ នៅពេលដែលនរណាម្នាក់និយាយថាគំរូមួយគឺ "បើក" សួរថាតើស្រទាប់ណាដែលបើក: កូដ ទម្ងន់ ទិន្នន័យ ឬគ្រាន់តែចូលប្រើ។ អានអាជ្ញាប័ណ្ណ។ ប្រៀបធៀបវាទៅនឹងករណីប្រើប្រាស់របស់អ្នក។ ហើយបន្ទាប់មក សំខាន់ សាកល្បងវាជាមួយនឹងបន្ទុកការងារពិតប្រាកដរបស់អ្នក។
ផ្នែកដ៏ល្អបំផុត ខុសពីវប្បធម៌៖ គម្រោងបើកចំហ អញ្ជើញការរួមចំណែក និងការត្រួតពិនិត្យ ដែលទំនងជាធ្វើឱ្យកម្មវិធី និងមនុស្សកាន់តែប្រសើរឡើង។ អ្នកអាចរកឃើញថាការផ្លាស់ប្តូរដែលឈ្នះមិនមែនជាគំរូដ៏ធំបំផុត ឬជាគំរូដ៏ភ្លឺស្វាងបំផុតនោះទេ ប៉ុន្តែជាអ្វីដែលអ្នកអាចយល់ ជួសជុល និងកែលម្អនៅសប្តាហ៍ក្រោយ។ នោះគឺជាថាមពលស្ងាត់របស់ Open Source AI - មិនមែនជាគ្រាប់កាំភ្លើងទេ វាដូចជាឧបករណ៍ច្រើនដែលពាក់យ៉ាងល្អដែលជួយសន្សំសំចៃថ្ងៃ។
អត់បានអានយូរពេក📝
Open Source AI គឺនិយាយអំពីសេរីភាពដ៏មានន័យក្នុងការប្រើប្រាស់ សិក្សា កែប្រែ និងចែករំលែកប្រព័ន្ធ AI ។ វាបង្ហាញឡើងនៅទូទាំងស្រទាប់៖ ក្របខ័ណ្ឌ គំរូ ទិន្នន័យ និងឧបករណ៍។ កុំច្រឡំប្រភពបើកចំហជាមួយនឹងទម្ងន់បើកចំហ ឬបើកការចូលប្រើ។ ពិនិត្យអាជ្ញាបណ្ណ វាយតម្លៃជាមួយនឹងកិច្ចការជាក់ស្តែងរបស់អ្នក និងការរចនាសម្រាប់សុវត្ថិភាព និងអភិបាលកិច្ចចាប់ពីថ្ងៃដំបូង។ ធ្វើវា នោះអ្នកនឹងទទួលបាននូវល្បឿន ការគ្រប់គ្រង និងផែនទីបង្ហាញផ្លូវកាន់តែស្ងប់ស្ងាត់។ គួរឱ្យភ្ញាក់ផ្អើល កម្ររកបានដោយស្មោះ 🙃។
ឯកសារយោង
[1] គំនិតផ្តួចផ្តើមប្រភពបើកចំហ - និយមន័យប្រភពបើកចំហ (OSD): អានបន្ថែម
[2] OSI - ការសិក្សាស៊ីជម្រៅលើ AI និងភាពបើកចំហ៖ អានបន្ថែម
[3] NIST - ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យ AI៖ អានបន្ថែម
[4] អាជ្ញាប័ណ្ណគំរូ Meta - Llama៖ អានបន្ថែម
[5] អាជ្ញាប័ណ្ណ AI ប្រកបដោយការទទួលខុសត្រូវ (OpenRAIL): អានបន្ថែម