តើ AI ប្រភពបើកចំហជាអ្វី?

បញ្ញាសិប្បនិម្មិតប្រភពបើកចំហត្រូវបានគេនិយាយអំពីវាដូចជាវាជាកូនសោវេទមន្តដែលដោះសោអ្វីៗគ្រប់យ៉ាង។ វាមិនមែនជារឿងចម្លែកទេ។ ប៉ុន្តែវា គឺជា វិធីជាក់ស្តែង និងងាយស្រួលអនុញ្ញាតដើម្បីបង្កើតប្រព័ន្ធបញ្ញាសិប្បនិម្មិតដែលអ្នកអាចយល់ កែលម្អ និងដាក់ឱ្យដំណើរការដោយមិនចាំបាច់អង្វរអ្នកលក់ឱ្យប្តូរ។ ប្រសិនបើអ្នកឆ្ងល់ថាអ្វីដែលត្រូវបានចាត់ទុកថាជា "បើកចំហ" អ្វីដែលគ្រាន់តែជាការធ្វើទីផ្សារ និងរបៀបប្រើប្រាស់វានៅកន្លែងធ្វើការ អ្នកនៅកន្លែងត្រឹមត្រូវហើយ។ ផឹកកាហ្វេមួយកែវ - នេះនឹងមានប្រយោជន៍ ហើយប្រហែលជាមានមតិផ្ទាល់ខ្លួនបន្តិចបន្តួច ☕🙂។

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 របៀបបញ្ចូល AI ទៅក្នុងអាជីវកម្មរបស់អ្នក
ជំហានជាក់ស្តែងក្នុងការរួមបញ្ចូលឧបករណ៍ AI សម្រាប់កំណើនអាជីវកម្មដ៏ឆ្លាតវៃ។

🔗 របៀបប្រើ AI ឱ្យកាន់តែមានផលិតភាព
ស្វែងយល់ពីដំណើរការការងារ AI ដែលមានប្រសិទ្ធភាព ដែលចំណេញពេលវេលា និងបង្កើនប្រសិទ្ធភាព។

🔗 តើជំនាញ AI ជាអ្វី?
ស្វែងយល់ពីសមត្ថភាព AI សំខាន់ៗដែលចាំបាច់សម្រាប់អ្នកជំនាញដែលត្រៀមរួចជាស្រេចនាពេលអនាគត។

🔗 តើ Google Vertex AI ជាអ្វី?
ស្វែងយល់អំពី Vertex AI របស់ Google និងរបៀបដែលវាសម្រួលដល់ការរៀនម៉ាស៊ីន។

តើអ្វីទៅជា Open Source AI? 🤖🔓

នៅសាមញ្ញបំផុត Open Source AI មានន័យថាធាតុផ្សំនៃប្រព័ន្ធ AI - កូដ ទម្ងន់គំរូ បំពង់បង្ហូរទិន្នន័យ ស្គ្រីបបណ្តុះបណ្តាល និងឯកសារ - ត្រូវបានចេញផ្សាយក្រោមអាជ្ញាប័ណ្ណដែលអនុញ្ញាតឱ្យនរណាម្នាក់ប្រើ សិក្សា កែប្រែ និងចែករំលែកវា ស្របតាមលក្ខខណ្ឌសមហេតុផល។ ភាសាសេរីភាពស្នូលនោះបានមកពីនិយមន័យប្រភពបើកចំហ និងគោលការណ៍យូរអង្វែងរបស់វានៃសេរីភាពអ្នកប្រើប្រាស់ [1]។ ភាពច្របូកច្របល់ជាមួយ AI គឺថាមានធាតុផ្សំច្រើនជាងកូដ។

គម្រោងខ្លះបោះពុម្ពផ្សាយអ្វីៗគ្រប់យ៉ាង៖ កូដ ប្រភពទិន្នន័យបណ្តុះបណ្តាល រូបមន្តធ្វើម្ហូប និងគំរូដែលបានបណ្តុះបណ្តាល។ គម្រោងផ្សេងទៀតចេញផ្សាយតែ ទម្ងន់ ដែលមានអាជ្ញាប័ណ្ណផ្ទាល់ខ្លួនប៉ុណ្ណោះ។ ប្រព័ន្ធអេកូឡូស៊ីប្រើអក្សរកាត់មិនស្អាតពេលខ្លះ ដូច្នេះសូមយើងរៀបចំវាឡើងវិញនៅផ្នែកបន្ទាប់។

Open Source AI vs open weights vs open access 😅

នេះជាកន្លែងដែលមនុស្សនិយាយឆ្លងឆ្លើយគ្នា។

បញ្ញាសិប្បនិម្មិតប្រភពបើកចំហ — គម្រោងនេះអនុវត្តតាមគោលការណ៍ប្រភពបើកចំហនៅទូទាំងជង់របស់វា។ កូដស្ថិតនៅក្រោមអាជ្ញាប័ណ្ណដែលត្រូវបានអនុម័តដោយ OSI ហើយលក្ខខណ្ឌចែកចាយអនុញ្ញាតឱ្យមានការប្រើប្រាស់ ការកែប្រែ និងការចែករំលែកយ៉ាងទូលំទូលាយ។ ស្មារតីនៅទីនេះឆ្លុះបញ្ចាំងពីអ្វីដែល OSI ពិពណ៌នា៖ សេរីភាពរបស់អ្នកប្រើប្រាស់ជាអាទិភាព [1][2]។
ទម្ងន់បើកចំហ — ទម្ងន់គំរូដែលបានហ្វឹកហាត់អាចទាញយកបាន (ជារឿយៗឥតគិតថ្លៃ) ប៉ុន្តែស្ថិតនៅក្រោមលក្ខខណ្ឌតាមតម្រូវការ។ អ្នកនឹងឃើញលក្ខខណ្ឌនៃការប្រើប្រាស់ ដែនកំណត់នៃការចែកចាយឡើងវិញ ឬច្បាប់រាយការណ៍។ ក្រុមគ្រួសារ Llama របស់ Meta បង្ហាញចំណុចនេះ៖ ប្រព័ន្ធអេកូឡូស៊ីកូដគឺបើកចំហ ប៉ុន្តែទម្ងន់គំរូត្រូវបានដឹកជញ្ជូនក្រោមអាជ្ញាប័ណ្ណជាក់លាក់ជាមួយនឹងលក្ខខណ្ឌផ្អែកលើការប្រើប្រាស់ [4]។
ការចូលប្រើដោយបើកចំហ — អ្នកអាចចូលប្រើ API ប្រហែលជាឥតគិតថ្លៃ ប៉ុន្តែអ្នកមិនទទួលបានទម្ងន់ទេ។ មានប្រយោជន៍សម្រាប់ការពិសោធន៍ ប៉ុន្តែមិនមែនជាប្រភពបើកចំហទេ។

នេះមិនមែនគ្រាន់តែជាអត្ថន័យ។ សិទ្ធិ និងហានិភ័យរបស់អ្នកផ្លាស់ប្តូរតាមប្រភេទទាំងនេះ។ ការងារបច្ចុប្បន្នរបស់ OSI លើ AI និងភាពបើកចំហរស្រាយនូវភាពខុសប្លែកគ្នាទាំងនេះជាភាសាសាមញ្ញ [2] ។

អ្វីដែលធ្វើឱ្យ Open Source AI ពិតជាល្អ ✅

ចូរយើងរហ័សនិងស្មោះត្រង់។

លទ្ធភាពធ្វើសវនកម្ម — អ្នកអាចអានកូដ ត្រួតពិនិត្យរូបមន្តទិន្នន័យ និងតាមដានជំហានបណ្តុះបណ្តាល។ វាជួយជាមួយនឹងការអនុលោមតាមច្បាប់ ការពិនិត្យសុវត្ថិភាព និងការចង់ដឹងចង់ឃើញបែបបុរាណ។ ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យ AI របស់ NIST លើកទឹកចិត្តដល់ការអនុវត្តឯកសារ និងតម្លាភាពដែលគម្រោងបើកចំហអាចបំពេញបានយ៉ាងងាយស្រួល [3]។
ភាពបត់បែន — អ្នកមិនត្រូវបានចងភ្ជាប់ទៅនឹងផែនទីបង្ហាញផ្លូវរបស់អ្នកលក់ទេ។ បំបែកវា។ បិទវា។ ដឹកជញ្ជូនវា។ Lego មិនមែនផ្លាស្ទិចស្អិតទេ។
ការគ្រប់គ្រងថ្លៃដើម — បង្ហោះដោយខ្លួនឯងនៅពេលដែលវាមានតម្លៃថោកជាង។ ផ្ទុះឡើងទៅជាពពកនៅពេលដែលវាមានតម្លៃថោកជាង។ លាយបញ្ចូលគ្នានូវផ្នែករឹង។
ល្បឿនសហគមន៍ — កំហុសត្រូវបានជួសជុល បង្កើតដី ហើយអ្នករៀនពីមិត្តភក្ដិ។ រញ៉េរញ៉ៃ? ពេលខ្លះ។ មានផលិតភាព? ជាញឹកញាប់។
ភាពច្បាស់លាស់នៃអភិបាលកិច្ច — អាជ្ញាប័ណ្ណបើកចំហពិតប្រាកដអាចទស្សន៍ទាយបាន។ ប្រៀបធៀបវាជាមួយលក្ខខណ្ឌនៃសេវាកម្ម API ដែលផ្លាស់ប្តូរស្ងាត់ៗនៅថ្ងៃអង្គារ។

តើវាល្អឥតខ្ចោះទេ? ទេ ប៉ុន្តែការដោះដូរគឺអាចយល់បាន - ច្រើនជាងអ្នកទទួលបានពីសេវាកម្មប្រអប់ខ្មៅជាច្រើន។

ជង់ AI ប្រភពបើកចំហ៖ កូដ ទម្ងន់ ទិន្នន័យ និងកាវ🧩

គិតពីគម្រោង AI ដូចជាឡាសាណាដែលប្លែក។ ស្រទាប់នៅគ្រប់ទីកន្លែង។

ក្របខ័ណ្ឌ និងពេលវេលាដំណើរការ — ឧបករណ៍ដើម្បីកំណត់ បណ្តុះបណ្តាល និងបម្រើគំរូ (ឧទាហរណ៍ PyTorch, TensorFlow)។ សហគមន៍ និងឯកសារដែលមានសុខភាពល្អមានសារៈសំខាន់ជាងឈ្មោះម៉ាក។
ស្ថាបត្យកម្មគំរូ — គំនូរព្រាង៖ ឧបករណ៍បំលែង គំរូសាយភាយ ការរៀបចំដែលបង្កើនការទាញយកមកវិញ។
ទម្ងន់ — ប៉ារ៉ាម៉ែត្រដែលបានរៀនក្នុងអំឡុងពេលបណ្តុះបណ្តាល។ “បើកចំហ” នៅទីនេះអាស្រ័យលើសិទ្ធិចែកចាយឡើងវិញ និងសិទ្ធិប្រើប្រាស់ពាណិជ្ជកម្ម មិនមែនគ្រាន់តែលទ្ធភាពទាញយកនោះទេ។
ទិន្នន័យ និងរូបមន្តធ្វើម្ហូប — ស្គ្រីបរៀបចំ តម្រង ការបន្ថែម កាលវិភាគបណ្តុះបណ្តាល។ តម្លាភាពនៅទីនេះគឺជាមាសសម្រាប់ភាពអាចបង្កើតឡើងវិញបាន។
ឧបករណ៍ និងការរៀបចំ — ម៉ាស៊ីនបម្រើការសន្និដ្ឋាន មូលដ្ឋានទិន្នន័យវ៉ិចទ័រ ឧបករណ៍វាយតម្លៃ សមត្ថភាពសង្កេត CI/CD។
ការផ្តល់អាជ្ញាប័ណ្ណ — ឆ្អឹងខ្នងដ៏ស្ងប់ស្ងាត់ដែលសម្រេចលើអ្វីដែលអ្នកពិតជាអាចធ្វើបាន។ មានព័ត៌មានបន្ថែមនៅខាងក្រោម។

អាជ្ញាប័ណ្ណ 101 សម្រាប់ Open Source AI 📜

អ្នកមិនចាំបាច់ធ្វើជាមេធាវីទេ។ អ្នកត្រូវកំណត់លំនាំ។

អាជ្ញាប័ណ្ណកូដដែលមានការអនុញ្ញាត — MIT, BSD, Apache-2.0។ Apache រួមបញ្ចូលការផ្តល់សិទ្ធិប៉ាតង់ជាក់លាក់មួយ ដែលក្រុមជាច្រើនពេញចិត្ត [1]។
កម្មសិទ្ធិបញ្ញា — គ្រួសារ GPL តម្រូវឱ្យដេរីវេនៅតែបើកចំហក្រោមអាជ្ញាប័ណ្ណដូចគ្នា។ មានឥទ្ធិពលខ្លាំង ប៉ុន្តែត្រូវរៀបចំផែនការសម្រាប់វានៅក្នុងស្ថាបត្យកម្មរបស់អ្នក។
អាជ្ញាប័ណ្ណជាក់លាក់តាមម៉ូដែល — សម្រាប់ទម្ងន់ និងសំណុំទិន្នន័យ អ្នកនឹងឃើញអាជ្ញាប័ណ្ណផ្ទាល់ខ្លួនដូចជាគ្រួសារអាជ្ញាប័ណ្ណ AI ដែលមានទំនួលខុសត្រូវ (OpenRAIL)។ ទាំងនេះអ៊ិនកូដការអនុញ្ញាត និងការរឹតបន្តឹងផ្អែកលើការប្រើប្រាស់។ ខ្លះអនុញ្ញាតឱ្យប្រើប្រាស់សម្រាប់ពាណិជ្ជកម្មយ៉ាងទូលំទូលាយ ខ្លះទៀតបន្ថែមរបាំងការពារជុំវិញការប្រើប្រាស់ខុស [5]។
Creative Commons សម្រាប់ទិន្នន័យ — CC-BY ឬ CC0 គឺជារឿងធម្មតាសម្រាប់សំណុំទិន្នន័យ និងឯកសារ។ ការបញ្ជាក់អត្តសញ្ញាណអាចគ្រប់គ្រងបានក្នុងទ្រង់ទ្រាយតូច។ បង្កើតគំរូតាំងពីដំបូង។

ព័ត៌មានជំនួយ៖ រក្សាបញ្ជីទំព័រតែមួយដែលរាយបញ្ជីភាពអាស្រ័យនីមួយៗ អាជ្ញាប័ណ្ណរបស់វា និងថាតើការចែកចាយឡើងវិញពាណិជ្ជកម្មត្រូវបានអនុញ្ញាត។ ធុញ? បាទ។ ចាំបាច់? បាទ។

តារាងប្រៀបធៀប៖ គម្រោង AI ប្រភពបើកចំហដ៏ពេញនិយម និងកន្លែងដែលពួកគេបញ្ចេញពន្លឺ📊

រញ៉េរញ៉ៃបន្តិចបន្តួចតាមគោលបំណង - នោះហើយជារបៀបដែលកំណត់ត្រាពិតប្រាកដមើលទៅ

ឧបករណ៍ / គម្រោង	តើវាសម្រាប់អ្នកណា	តម្លៃ	ហេតុអ្វីបានជាវាដំណើរការបានល្អ
PyTorch	អ្នកស្រាវជ្រាវ, វិស្វករ	ឥតគិតថ្លៃ	ក្រាហ្វថាមវន្ត សហគមន៍ដ៏ធំ ឯកសាររឹងមាំ។ សមរភូមិ-សាកល្បងនៅក្នុងផលិតផល។
TensorFlow	ក្រុមសហគ្រាស, ML ops	ឥតគិតថ្លៃ	របៀបក្រាហ្វ, TF-Serving, ជម្រៅប្រព័ន្ធអេកូ។ ការរៀនសូត្រកាន់តែរឹងមាំសម្រាប់អ្នកខ្លះ។
អ្នកប្រែរូបមុខឱប	អ្នកសាងសង់ដែលមានកាលកំណត់	ឥតគិតថ្លៃ	គំរូដែលបានហ្វឹកហាត់ជាមុន បំពង់បង្ហូរ សំណុំទិន្នន័យ ការលៃតម្រូវងាយស្រួល។ ត្រង់ផ្លូវកាត់។
vLLM	ក្រុមដែលមានគំនិតអ៊ីនហ្វ្រារ៉េដ	ឥតគិតថ្លៃ	ការបម្រើ LLM លឿន ឃ្លាំងសម្ងាត់ KV ប្រកបដោយប្រសិទ្ធភាព ដំណើរការខ្លាំងនៅលើ GPU ទូទៅ។
Llama.cpp	Tinkerers ឧបករណ៍គែម	ឥតគិតថ្លៃ	ដំណើរការម៉ូដែលក្នុងស្រុកនៅលើកុំព្យូទ័រយួរដៃ និងទូរស័ព្ទជាមួយនឹងការធ្វើបរិមាណ។
ឡាងឆាយន	កម្មវិធី devs, គំរូដើម	ឥតគិតថ្លៃ	ខ្សែសង្វាក់ដែលអាចផ្សំបាន ឧបករណ៍ភ្ជាប់ ភ្នាក់ងារ។ ឈ្នះរហ័ស ប្រសិនបើអ្នករក្សាវាឱ្យសាមញ្ញ។
ការសាយភាយមានស្ថេរភាព	ការច្នៃប្រឌិត ក្រុមផលិតផល	ទម្ងន់ឥតគិតថ្លៃ	ការបង្កើតរូបភាពក្នុងតំបន់ឬពពក; លំហូរការងារដ៏ធំ និង UI នៅជុំវិញវា។
អូឡាម៉ា	អ្នកអភិវឌ្ឍន៍ដែលស្រឡាញ់ CLIs ក្នុងស្រុក	ឥតគិតថ្លៃ	ទាញ និងដំណើរការម៉ូដែលក្នុងស្រុក។ អាជ្ញាប័ណ្ណខុសគ្នាតាមកាតគំរូ—មើលវា។

បាទ "ឥតគិតថ្លៃ" ជាច្រើន។ ការបង្ហោះ GPUs កន្លែងផ្ទុក និងម៉ោងមនុស្សគឺមិនគិតថ្លៃទេ។

របៀបដែលក្រុមហ៊ុនពិតជាប្រើប្រាស់ Open Source AI នៅកន្លែងធ្វើការ 🏢⚙️

អ្នកនឹងឮពីរយ៉ាង៖ ទាំងអ្នករាល់គ្នាគួរធ្វើជាម្ចាស់ផ្ទះគ្រប់យ៉ាងដោយខ្លួនឯង ឬក៏គ្មានអ្នកណាគួរដែរ។ ជីវិតពិតគឺ squishier ។

ការបង្កើតគំរូដើមយ៉ាងរហ័ស — ចាប់ផ្តើមជាមួយនឹងគំរូបើកចំហដែលអនុញ្ញាត ដើម្បីផ្ទៀងផ្ទាត់ UX និងផលប៉ះពាល់។ ធ្វើការកែតម្រូវឡើងវិញនៅពេលក្រោយ។
ការបម្រើសេវាកម្មចម្រុះ — រក្សាគំរូដែលបង្ហោះដោយ VPC ឬនៅនឹងកន្លែងសម្រាប់ការហៅទូរសព្ទដែលងាយរងគ្រោះដោយភាពឯកជន។ ត្រឡប់ទៅប្រើ API ដែលបង្ហោះវិញសម្រាប់បន្ទុកវែង ឬបន្ទុកមុតស្រួច។ ធម្មតាណាស់។
ការលៃតម្រូវសម្រាប់កិច្ចការតូចចង្អៀត — ការសម្របខ្លួនតាមដែនជារឿយៗលើសពីមាត្រដ្ឋានឆៅ។
RAG នៅគ្រប់ទីកន្លែង — ការបង្កើតឡើងវិញដែលបង្កើនប្រសិទ្ធភាពកាត់បន្ថយការយល់ច្រឡំដោយការផ្តល់ចម្លើយជាមូលដ្ឋាននៅក្នុងទិន្នន័យរបស់អ្នក។ មូលដ្ឋានទិន្នន័យវ៉ិចទ័របើកចំហ និងអាដាប់ទ័រធ្វើឱ្យរឿងនេះងាយស្រួលទាក់ទង។
Edge និងក្រៅបណ្តាញ — ម៉ូដែលទម្ងន់ស្រាលដែលចងក្រងឡើងសម្រាប់កុំព្យូទ័រយួរដៃ ទូរស័ព្ទ ឬកម្មវិធីរុករកពង្រីកផ្ទៃផលិតផល។
ការអនុលោមតាមច្បាប់ និងការធ្វើសវនកម្ម — ដោយសារតែអ្នកអាចត្រួតពិនិត្យភាពវៃឆ្លាត អ្នកសវនករមានអ្វីមួយជាក់លាក់ដើម្បីពិនិត្យ។ ផ្គូផ្គងវាជាមួយនឹងគោលនយោបាយ AI ដ៏មានទំនួលខុសត្រូវ ដែលផ្គូផ្គងទៅនឹងប្រភេទ RMF របស់ NIST និងការណែនាំឯកសារ [3]។

កំណត់ចំណាំតូចមួយ៖ ក្រុម SaaS ដែលគិតគូរពីភាពឯកជនដែលខ្ញុំបានឃើញ (អ្នកប្រើប្រាស់ទីផ្សារមធ្យម និងសហភាពអឺរ៉ុប) បានអនុម័តការរៀបចំកូនកាត់៖ គំរូបើកចំហតូចមួយនៅក្នុង VPC សម្រាប់ 80% នៃសំណើ; ផ្ទុះឡើងទៅកាន់ API ដែលបានបង្ហោះសម្រាប់ការជំរុញបរិបទវែង និងកម្រ។ ពួកគេបានកាត់បន្ថយភាពយឺតយ៉ាវសម្រាប់ផ្លូវទូទៅ និងធ្វើឱ្យឯកសារ DPIA សាមញ្ញ - ដោយមិនចាំបាច់ដាំទឹកពុះ។

ហានិភ័យ និង gotchas ដែលអ្នកគួរតែរៀបចំផែនការសម្រាប់🧨

ចូរយើងក្លាយជាមនុស្សពេញវ័យអំពីរឿងនេះ។

ការរសាត់បាត់អាជ្ញាប័ណ្ណ — ឃ្លាំងទិន្នន័យចាប់ផ្តើម MIT បន្ទាប់មកទម្ងន់ផ្លាស់ទីទៅអាជ្ញាប័ណ្ណផ្ទាល់ខ្លួន។ រក្សាការចុះបញ្ជីផ្ទៃក្នុងរបស់អ្នកឱ្យទាន់សម័យ ឬអ្នកនឹងផ្ញើការភ្ញាក់ផ្អើលអំពីការអនុលោមតាមច្បាប់ [2][4][5]។
ប្រភពទិន្នន័យ — ទិន្នន័យបណ្តុះបណ្តាលដែលមានសិទ្ធិមិនច្បាស់លាស់អាចហូរចូលទៅក្នុងគំរូ។ តាមដានប្រភព និងអនុវត្តតាមអាជ្ញាប័ណ្ណសំណុំទិន្នន័យ មិនមែន vibes [5] ទេ។
សុវត្ថិភាព — ចាត់ទុកវត្ថុបុរាណគំរូដូចខ្សែសង្វាក់ផ្គត់ផ្គង់ផ្សេងទៀតដែរ៖ checksums, signed releases, SBOMs។ សូម្បីតែ SECURITY.md តិចតួចបំផុតក៏អាចយកឈ្នះភាពស្ងៀមស្ងាត់បានដែរ។
ភាពខុសគ្នានៃគុណភាព — គំរូបើកចំហមានភាពខុសគ្នាយ៉ាងទូលំទូលាយ។ វាយតម្លៃជាមួយភារកិច្ចរបស់អ្នក មិនមែនគ្រាន់តែតារាងពិន្ទុនោះទេ។
ថ្លៃដើមហេដ្ឋារចនាសម្ព័ន្ធដែលលាក់កំបាំង — ការសន្និដ្ឋានរហ័សត្រូវការ GPU ការធ្វើបរិមាណ ការចាត់ថ្នាក់ និងការរក្សាទុកទិន្នន័យក្នុងឃ្លាំងសម្ងាត់។ ឧបករណ៍បើកចំហជួយបាន; អ្នកនៅតែបង់ប្រាក់ក្នុងការគណនា។
បំណុលអភិបាលកិច្ច — ប្រសិនបើគ្មាននរណាម្នាក់ជាម្ចាស់វដ្តជីវិតរបស់គំរូទេ អ្នកនឹងទទួលបានស្ប៉ាហ្គេទីកំណត់រចនាសម្ព័ន្ធ។ បញ្ជីត្រួតពិនិត្យ MLOps ទម្ងន់ស្រាលគឺជាមាស។

ការជ្រើសរើសកម្រិតបើកចំហរត្រឹមត្រូវសម្រាប់ករណីប្រើប្រាស់របស់អ្នក🧭

ផ្លូវសម្រេចចិត្តខុសបន្តិច៖

ត្រូវការ ការដឹកជញ្ជូនលឿន ជាមួយនឹងតម្រូវការអនុលោមតាមពន្លឺ? ចាប់ផ្តើមជាមួយនឹងម៉ូដែលបើកចំហដែលមានការអនុញ្ញាត ការលៃតម្រូវតិចតួច ការបម្រើលើពពក។
ត្រូវការ ភាពឯកជនដ៏តឹងរឹង ឬ ប្រតិបត្តិការ ក្រៅបណ្តាញ ? ជ្រើសរើសជង់បើកចំហដែលគាំទ្រយ៉ាងល្អ ការសន្និដ្ឋានដោយខ្លួនឯង និងពិនិត្យអាជ្ញាប័ណ្ណដោយប្រុងប្រយ័ត្ន។
ត្រូវការ សិទ្ធិពាណិជ្ជកម្មទូលំទូលាយ និងការចែកចាយឡើងវិញទេ? ចូលចិត្តកូដដែលបានតម្រឹម OSI បូកនឹងអាជ្ញាប័ណ្ណគំរូដែលអនុញ្ញាតយ៉ាងច្បាស់ក្នុងការប្រើប្រាស់ពាណិជ្ជកម្ម និងការចែកចាយឡើងវិញ [1][5] ។
ត្រូវការ ភាពបត់បែននៃការស្រាវជ្រាវ? បន្តការអនុញ្ញាតពីចុងដល់ចប់ រួមទាំងទិន្នន័យ សម្រាប់ការផលិតឡើងវិញ និងលទ្ធភាពចែករំលែក។
មិនប្រាកដទេ? អ្នកបើកយន្តហោះទាំងពីរ។ ផ្លូវមួយនឹងមានអារម្មណ៍ប្រសើរជាងមុនក្នុងមួយសប្តាហ៍។

របៀបវាយតម្លៃគម្រោង Open Source AI ដូចអ្នកជំនាញ🔍

បញ្ជីពិនិត្យរហ័សដែលខ្ញុំរក្សាទុក ជួនកាលនៅលើកន្សែង។

ភាពច្បាស់លាស់នៃអាជ្ញាប័ណ្ណ — មានការអនុម័តដោយ OSI សម្រាប់កូដ? ចុះទម្ងន់ និងទិន្នន័យវិញ? តើមានការដាក់កំហិតការប្រើប្រាស់ណាមួយដែលធ្វើឲ្យខូចគំរូអាជីវកម្មរបស់អ្នក [1][2][5] ដែរឬទេ?
ឯកសារ — ដំឡើង ការចាប់ផ្តើមរហ័ស ឧទាហរណ៍ ការដោះស្រាយបញ្ហា។ ឯកសារគឺជាសញ្ញាវប្បធម៌។
ចង្វាក់នៃការចេញផ្សាយ — ការចេញផ្សាយ និងកំណត់ហេតុផ្លាស់ប្ដូរដែលមានស្លាកបង្ហាញពីស្ថេរភាព។ ការជំរុញម្តងម្កាលបង្ហាញពីវីរភាព។
ស្តង់ដារ និងការវាយតម្លៃ — ភារកិច្ចមានភាពប្រាកដនិយម? ការវាយតម្លៃអាចដំណើរការបាន?
ការថែទាំ និងអភិបាលកិច្ច — ម្ចាស់កូដច្បាស់លាស់ ការបែងចែកបញ្ហា ការឆ្លើយតបរបស់ PR។
ភាពសមស្របនៃប្រព័ន្ធអេកូឡូស៊ី — ដំណើរការបានល្អជាមួយផ្នែករឹង ការផ្ទុកទិន្នន័យ ការកត់ត្រា និងការអនុញ្ញាតរបស់អ្នក។
ឥរិយាបថសុវត្ថិភាព — វត្ថុបុរាណដែលបានចុះហត្ថលេខា ការស្កេនភាពអាស្រ័យ ការដោះស្រាយ CVE។
សញ្ញាសហគមន៍ — ការពិភាក្សា ចម្លើយលើវេទិកា ឧទាហរណ៍នៃឃ្លាំងផ្ទុកទិន្នន័យ។

សម្រាប់ការតម្រឹមកាន់តែទូលំទូលាយជាមួយការអនុវត្តដែលគួរឱ្យទុកចិត្ត សូមគូសផែនទីដំណើរការរបស់អ្នកទៅប្រភេទ NIST AI RMF និងវត្ថុបុរាណនៃឯកសារ [3] ។

ការជ្រមុជទឹកជ្រៅ 1: ពាក់កណ្តាលដ៏រញ៉េរញ៉ៃនៃអាជ្ញាប័ណ្ណគំរូ🧪

ម៉ូដែលដែលមានសមត្ថភាពបំផុតមួយចំនួនស្ថិតនៅក្នុងធុង "ទម្ងន់បើកចំហជាមួយលក្ខខណ្ឌ"។ ពួកវាអាចចូលប្រើបាន ប៉ុន្តែមានដែនកំណត់ការប្រើប្រាស់ ឬច្បាប់ចែកចាយឡើងវិញ។ នោះអាចល្អប្រសិនបើផលិតផលរបស់អ្នកមិនអាស្រ័យលើការវេចខ្ចប់ម៉ូដែលឡើងវិញ ឬការដឹកជញ្ជូនវាទៅក្នុងបរិយាកាសអតិថិជន។ ប្រសិនបើអ្នក ពិតជា ត្រូវការវា សូមចរចា ឬជ្រើសរើសមូលដ្ឋានផ្សេង។ ចំណុចសំខាន់គឺត្រូវផ្គូផ្គង របស់អ្នក ទល់នឹង ពិតប្រាកដ មិនមែនប្រកាសប្លក់ទេ [4][5]។

អាជ្ញាប័ណ្ណរចនាប័ទ្ម OpenRAIL ព្យាយាមធ្វើឱ្យមានតុល្យភាព៖ លើកទឹកចិត្តឱ្យមានការស្រាវជ្រាវបើកចំហ និងការចែករំលែក ខណៈពេលដែលរារាំងការប្រើប្រាស់ខុស។ ចេតនាគឺល្អ; កាតព្វកិច្ចនៅតែជារបស់អ្នក។ អានលក្ខខណ្ឌ ហើយសម្រេចចិត្តថាតើលក្ខខណ្ឌសមនឹងចំណង់ហានិភ័យរបស់អ្នកដែរឬទេ [5] ។

ការជ្រមុជទឹកជ្រៅ 2៖ តម្លាភាពទិន្នន័យ និងទេវកថានៃការផលិតឡើងវិញ🧬

«បើគ្មានការបោះចោលទិន្នន័យពេញលេញទេ បញ្ញាសិប្បនិម្មិតប្រភពបើកចំហគឺជាក្លែងក្លាយ»។ មិនមែនទាំងស្រុងទេ។ ប្រភព និង រូបមន្តធ្វើម្ហូប អាចផ្តល់នូវតម្លាភាពដែលមានអត្ថន័យ ទោះបីជាសំណុំទិន្នន័យឆៅមួយចំនួនត្រូវបានកំណត់ក៏ដោយ។ អ្នកអាចកត់ត្រាតម្រង សមាមាត្រគំរូ និងការសម្អាតការវិភាគបានល្អគ្រប់គ្រាន់សម្រាប់ក្រុមមួយផ្សេងទៀតដើម្បីប៉ាន់ស្មានលទ្ធផល។ ការផលិតឡើងវិញដ៏ល្អឥតខ្ចោះគឺល្អ។ តម្លាភាពដែលអាចអនុវត្តបានជារឿយៗគ្រប់គ្រាន់ [3][5]។

នៅពេលដែលសំណុំទិន្នន័យត្រូវបានបើក រសជាតិ Creative Commons ដូចជា CC-BY ឬ CC0 គឺជារឿងធម្មតា។ ការបញ្ជាក់តាមមាត្រដ្ឋានអាចមានភាពឆ្គាំឆ្គង ដូច្នេះសូមកំណត់ស្តង់ដារពីរបៀបដែលអ្នកដោះស្រាយវាឱ្យបានឆាប់។

ការជ្រមុជទឹកជ្រៅ 3: MLOps ជាក់ស្តែងសម្រាប់ម៉ូដែលបើកចំហ🚢

ការដឹកជញ្ជូនគំរូបើកចំហគឺដូចជាការដឹកជញ្ជូនសេវាកម្មណាមួយ បូករួមទាំងការទាក់ទាញមួយចំនួន។

ស្រទាប់បម្រើ — ម៉ាស៊ីនមេសន្និដ្ឋានឯកទេសបង្កើនប្រសិទ្ធភាពការចាត់ថ្នាក់ជាបាច់ ការគ្រប់គ្រងឃ្លាំងសម្ងាត់ KV និងការផ្សាយសញ្ញាសម្ងាត់។
បរិមាណនីយកម្ម — ទម្ងន់តូចជាង → ការសន្និដ្ឋានថោកជាង និងការដាក់ពង្រាយគែមកាន់តែងាយស្រួល។ ការសម្របសម្រួលគុណភាពគឺខុសគ្នា; វាស់វែងជាមួយ ភារកិច្ច របស់អ្នក ។
ភាពអាចសង្កេតបាន — កត់ត្រាការណែនាំ/លទ្ធផលដោយគិតគូរពីភាពឯកជន។ គំរូសម្រាប់វាយតម្លៃ។ បន្ថែមការត្រួតពិនិត្យការរសាត់ដូចដែលអ្នកធ្វើសម្រាប់ ML បែបប្រពៃណី។
ការអាប់ដេត — ម៉ូដែលអាចផ្លាស់ប្តូរឥរិយាបថដោយប្រយោល; ប្រើសត្វចាប និងរក្សាបណ្ណសារសម្រាប់ការរំកិលថយក្រោយ និងការធ្វើសវនកម្ម។
ការវាយតម្លៃ — រក្សាសំណុំការវាយតម្លៃជាក់លាក់សម្រាប់ភារកិច្ច មិនមែនគ្រាន់តែជាស្តង់ដារទូទៅនោះទេ។ រួមបញ្ចូលទាំងការជំរុញប្រឆាំង និងថវិកាពន្យារពេល។

ប្លង់តូច៖ ពីសូន្យទៅអ្នកបើកយន្តហោះដែលអាចប្រើបានក្នុង 10 ជំហាន🗺️

កំណត់កិច្ចការតូចចង្អៀតមួយ និងម៉ែត្រ។ មិនមានវេទិកាដ៏អស្ចារ្យនៅឡើយទេ។
ជ្រើសរើសគំរូមូលដ្ឋានដែលមានការអនុញ្ញាត ដែលត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយ និងមានឯកសារយ៉ាងល្អ។
ក្រោកឈរឡើងការសន្និដ្ឋានក្នុងស្រុក និង API រុំស្តើង។ ទុកវាឱ្យធុញ។
បន្ថែមការទាញយកទៅលទ្ធផលមូលដ្ឋានលើទិន្នន័យរបស់អ្នក។
រៀបចំសំណុំវាយតម្លៃដែលមានស្លាកតូចមួយដែលឆ្លុះបញ្ចាំងពីអ្នកប្រើប្រាស់របស់អ្នក ឬស និងទាំងអស់។
បទភ្លេងល្អ ឬប្រណិតបានលុះត្រាតែការវាយតម្លៃប្រាប់ថាអ្នកគួរ។
គណនាបរិមាណប្រសិនបើភាពយឺតយ៉ាវ ឬតម្លៃខាំ។ វាស់គុណភាពឡើងវិញ។
បន្ថែមការកត់ត្រា ការជម្រុញក្រុមក្រហម និងគោលការណ៍បំពាន។
ច្រកទ្វារដែលមានទង់មុខងារ ហើយបញ្ចេញទៅក្រុមតូចមួយ។
ធ្វើម្តងទៀត។ ដឹកជញ្ជូនការកែលម្អតិចតួចរៀងរាល់សប្តាហ៍... ឬនៅពេលដែលវាប្រសើរជាងពិតប្រាកដ។

ទេវកថាទូទៅអំពី Open Source AI បានបង្ហាញចេញបន្តិច🧱

ទេវកថា: ម៉ូដែលបើកចំហគឺតែងតែអាក្រក់។ ការពិត៖ សម្រាប់កិច្ចការដែលបានកំណត់គោលដៅជាមួយនឹងទិន្នន័យត្រឹមត្រូវ ម៉ូដែលបើកចំហដែលបានកែតម្រូវអាចដំណើរការបានច្រើនជាងការបង្ហោះធំជាង។
ទេវកថា៖ បើកចំហមានន័យថាគ្មានសុវត្ថិភាព។ ការពិត៖ ភាពបើកចំហអាចកែលម្អការពិនិត្យមើល។ សុវត្ថិភាពអាស្រ័យលើការអនុវត្តមិនមែនជាការសម្ងាត់ [3] ។
ទេវកថា៖ អាជ្ញាប័ណ្ណមិនមានបញ្ហាទេប្រសិនបើវាឥតគិតថ្លៃ។ ការពិត៖ វាសំខាន់ បំផុត នៅពេលដែលវាឥតគិតថ្លៃ ពីព្រោះការឥតគិតថ្លៃធ្វើឱ្យការប្រើប្រាស់មានមាត្រដ្ឋាន។ អ្នកចង់បានសិទ្ធិជាក់លាក់ មិនមែនភាពរំជើបរំជួលទេ [1][5]។

ប្រភពបើកចំហ AI 🧠✨

Open Source AI មិនមែនជាសាសនាទេ។ វាជាសំណុំនៃសេរីភាពជាក់ស្តែង ដែលអនុញ្ញាតឱ្យអ្នកបង្កើតជាមួយនឹងការគ្រប់គ្រងកាន់តែច្រើន អភិបាលកិច្ចកាន់តែច្បាស់ និងការធ្វើម្តងទៀតលឿនជាងមុន។ នៅពេលដែលនរណាម្នាក់និយាយថាគំរូមួយគឺ "បើក" សួរថាតើស្រទាប់ណាដែលបើក: កូដ ទម្ងន់ ទិន្នន័យ ឬគ្រាន់តែចូលប្រើ។ អានអាជ្ញាប័ណ្ណ។ ប្រៀបធៀបវាទៅនឹងករណីប្រើប្រាស់របស់អ្នក។ ហើយបន្ទាប់មក សំខាន់ សាកល្បងវាជាមួយនឹងបន្ទុកការងារពិតប្រាកដរបស់អ្នក។

ផ្នែកដ៏ល្អបំផុត ខុសពីវប្បធម៌៖ គម្រោងបើកចំហ អញ្ជើញការរួមចំណែក និងការត្រួតពិនិត្យ ដែលទំនងជាធ្វើឱ្យកម្មវិធី និងមនុស្សកាន់តែប្រសើរឡើង។ អ្នកអាចរកឃើញថាការផ្លាស់ប្តូរដែលឈ្នះមិនមែនជាគំរូដ៏ធំបំផុត ឬជាគំរូដ៏ភ្លឺស្វាងបំផុតនោះទេ ប៉ុន្តែជាអ្វីដែលអ្នកអាចយល់ ជួសជុល និងកែលម្អនៅសប្តាហ៍ក្រោយ។ នោះគឺជាថាមពលស្ងាត់របស់ Open Source AI - មិនមែនជាគ្រាប់កាំភ្លើងទេ វាដូចជាឧបករណ៍ច្រើនដែលពាក់យ៉ាងល្អដែលជួយសន្សំសំចៃថ្ងៃ។

អត់បានអានយូរពេក📝

Open Source AI គឺនិយាយអំពីសេរីភាពដ៏មានន័យក្នុងការប្រើប្រាស់ សិក្សា កែប្រែ និងចែករំលែកប្រព័ន្ធ AI ។ វាបង្ហាញឡើងនៅទូទាំងស្រទាប់៖ ក្របខ័ណ្ឌ គំរូ ទិន្នន័យ និងឧបករណ៍។ កុំច្រឡំប្រភពបើកចំហជាមួយនឹងទម្ងន់បើកចំហ ឬបើកការចូលប្រើ។ ពិនិត្យអាជ្ញាបណ្ណ វាយតម្លៃជាមួយនឹងកិច្ចការជាក់ស្តែងរបស់អ្នក និងការរចនាសម្រាប់សុវត្ថិភាព និងអភិបាលកិច្ចចាប់ពីថ្ងៃដំបូង។ ធ្វើវា នោះអ្នកនឹងទទួលបាននូវល្បឿន ការគ្រប់គ្រង និងផែនទីបង្ហាញផ្លូវកាន់តែស្ងប់ស្ងាត់។ គួរឱ្យភ្ញាក់ផ្អើល កម្ររកបានដោយស្មោះ 🙃។

ឯកសារយោង

[1] គំនិតផ្តួចផ្តើមប្រភពបើកចំហ - និយមន័យប្រភពបើកចំហ (OSD): អានបន្ថែម
[2] OSI - ការសិក្សាស៊ីជម្រៅលើ AI និងភាពបើកចំហ៖ អានបន្ថែម
[3] NIST - ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យ AI៖ អានបន្ថែម
[4] អាជ្ញាប័ណ្ណគំរូ Meta - Llama៖ អានបន្ថែម
[5] អាជ្ញាប័ណ្ណ AI ប្រកបដោយការទទួលខុសត្រូវ (OpenRAIL): អានបន្ថែម

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ

តើ​អ្វី​ទៅ​ជា Open Source AI? 🤖🔓