តើ Edge AI ជាអ្វី?

Edge AI ជំរុញការស៊ើបការណ៍សម្ងាត់ទៅកាន់កន្លែងដែលទិន្នន័យកើត។ វាស្តាប់ទៅដូចជាស្រើបស្រាល ប៉ុន្តែគំនិតស្នូលគឺសាមញ្ញ៖ ធ្វើការគិតនៅជាប់នឹងឧបករណ៍ចាប់សញ្ញា ដូច្នេះលទ្ធផលនឹងបង្ហាញឡើងឥឡូវនេះ មិនមែននៅពេលក្រោយទេ។ អ្នកទទួលបានល្បឿន ភាពអាចជឿជាក់បាន និងរឿងរ៉ាវឯកជនភាពសមរម្យដោយមិនចាំបាច់មានអ្នកមើលថែទាំក្មេងគ្រប់ការសម្រេចចិត្ត។ ចូរស្រាយវាចេញ - ផ្លូវកាត់ និងដំណើរស្វែងរកចំហៀងរួមបញ្ចូល។ 😅

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 តើអ្វីទៅជា AI ជំនាន់
ការពន្យល់ច្បាស់លាស់នៃ AI ជំនាន់មុន របៀបដែលវាដំណើរការ និងការប្រើប្រាស់ជាក់ស្តែង។

🔗 តើអ្វីទៅជាភ្នាក់ងារ AI
ទិដ្ឋភាពទូទៅនៃភ្នាក់ងារ AI ឥរិយាបថស្វយ័ត និងគំរូកម្មវិធីក្នុងពិភពពិត។

🔗 តើអ្វីទៅជា AI ធ្វើមាត្រដ្ឋាន
ស្វែងយល់ពីរបៀបធ្វើមាត្រដ្ឋានប្រព័ន្ធ AI ប្រកបដោយភាពជឿជាក់ ប្រសិទ្ធភាព និងការចំណាយប្រកបដោយប្រសិទ្ធភាព។

🔗 អ្វីទៅជាក្របខ័ណ្ឌកម្មវិធីសម្រាប់ AI
ការបំបែកក្របខ័ណ្ឌកម្មវិធី AI អត្ថប្រយោជន៍ស្ថាបត្យកម្ម និងមូលដ្ឋានគ្រឹះនៃការអនុវត្ត។

តើ Edge AI ជាអ្វី? និយមន័យរហ័ស 🧭

Edge AI គឺជាការអនុវត្តនៃការដំណើរការម៉ូដែលរៀនម៉ាស៊ីនដែលបានបណ្តុះបណ្តាលដោយផ្ទាល់នៅលើ ឬនៅជិតឧបករណ៍ដែលប្រមូលទិន្នន័យ ទូរស័ព្ទ កាមេរ៉ា មនុស្សយន្ត រថយន្ត ឧបករណ៍ពាក់ ឧបករណ៍បញ្ជាឧស្សាហកម្ម ដែលអ្នកដាក់ឈ្មោះវា។ ជំនួសឱ្យការដឹកជញ្ជូនទិន្នន័យឆៅទៅកាន់ម៉ាស៊ីនមេឆ្ងាយសម្រាប់ការវិភាគ ឧបករណ៍ដំណើរការបញ្ចូលក្នុងមូលដ្ឋាន ហើយផ្ញើតែសេចក្តីសង្ខេប ឬគ្មានអ្វីទាំងអស់។ ការធ្វើដំណើរទៅមកតិចជាង ភាពយឺតយ៉ាវតិច ការគ្រប់គ្រងកាន់តែច្រើន។ ប្រសិនបើអ្នកចង់បានអ្នកពន្យល់អ្នកលក់ស្អាត ចាប់ផ្តើមនៅទីនេះ។ [1]

តើអ្វីដែលធ្វើឱ្យ Edge AI ពិតជាមានប្រយោជន៍? 🌟

ភាពយឺតយ៉ាវទាប - ការសម្រេចចិត្តកើតឡើងនៅលើឧបករណ៍ ដូច្នេះការឆ្លើយតបនឹងមានអារម្មណ៍ភ្លាមៗសម្រាប់កិច្ចការនៃការយល់ឃើញ ដូចជាការរកឃើញវត្ថុ ការដាស់ពាក្យ ឬការជូនដំណឹងអំពីភាពមិនប្រក្រតី។ [1]
ភាពឯកជនតាមតំបន់ - ទិន្នន័យរសើបអាចស្ថិតនៅលើឧបករណ៍ កាត់បន្ថយការប៉ះពាល់ និងជួយក្នុងការពិភាក្សាកាត់បន្ថយទិន្នន័យ។ [1]
ការសន្សំកម្រិតបញ្ជូន - ផ្ញើលក្ខណៈពិសេស ឬព្រឹត្តិការណ៍ជំនួសឱ្យស្ទ្រីមឆៅ។ [1]
ភាពធន់ - ដំណើរការក្នុងអំឡុងពេលភ្ជាប់ស្គ្រីប។
ការគ្រប់គ្រងថ្លៃដើម - វដ្តគណនាពពកតិចជាងមុន និងដំណើរការទាប។
ការយល់ដឹងអំពីបរិបទ - ឧបករណ៍ "មានអារម្មណ៍" បរិស្ថាន និងសម្របខ្លួន។

សង្ខេបខ្លីៗ៖ អ្នកបើកយន្តហោះលក់រាយបានផ្លាស់ប្តូរការបង្ហោះកាមេរ៉ាថេរសម្រាប់ការចាត់ថ្នាក់មនុស្សទល់នឹងវត្ថុនៅលើឧបករណ៍ ហើយបានជំរុញតែការរាប់ម៉ោង និងឈុតលើកលែងប៉ុណ្ណោះ។ លទ្ធផល៖ ការដាស់តឿនរង 200 ms នៅគែមធ្នើ និង ~ 90% ធ្លាក់ចុះក្នុងចរាចរណ៍ឡើងលើ-ដោយមិនផ្លាស់ប្តូរកិច្ចសន្យា WAN ហាង។ (វិធីសាស្រ្ត៖ ការសន្និដ្ឋានក្នុងស្រុក ការប្រមូលព្រឹត្តិការណ៍ ភាពមិនប្រក្រតីតែប៉ុណ្ណោះ។ )

Edge AI vs cloud AI - កម្រិតពណ៌រហ័ស🥊

កន្លែងដែលការគណនាកើតឡើង: edge = on-device/near-device; ពពក = មជ្ឈមណ្ឌលទិន្នន័យពីចម្ងាយ។
ភាពយឺតយ៉ាវ៖ គែម ≈ ពេលវេលាជាក់ស្តែង; ពពកមានការធ្វើដំណើរទៅមក។
ចលនាទិន្នន័យ៖ តម្រងគែម/បង្ហាប់ជាមុនសិន; cloud ចូលចិត្តការបង្ហោះដែលមានភាពស្មោះត្រង់ពេញលេញ។
ភាពជឿជាក់៖ គែមបន្តដំណើរការក្រៅបណ្តាញ។ ពពកត្រូវការការតភ្ជាប់។
អភិបាលកិច្ច: edge គាំទ្រការបង្រួមទិន្នន័យ។ ពពកធ្វើការត្រួតពិនិត្យជាកណ្តាល។ [1]

វាមិនមែនទាំងឬក៏អត់។ ប្រព័ន្ធឆ្លាតវៃរួមបញ្ចូលគ្នាទាំងពីរ៖ ការសម្រេចចិត្តរហ័សក្នុងមូលដ្ឋាន ការវិភាគកាន់តែស៊ីជម្រៅ និងការរៀនកងនាវានៅកណ្តាល។ ចម្លើយកូនកាត់គឺគួរឱ្យធុញ និងត្រឹមត្រូវ។

របៀបដែល Edge AI ពិតជាដំណើរការនៅក្រោមក្រណាត់🧩

ឧបករណ៍ចាប់សញ្ញា ចាប់យកសញ្ញាឆៅ-ស៊ុមអូឌីយ៉ូ, ភីកសែលកាមេរ៉ា, ការប៉ះ IMU, ដានរំញ័រ។
ដំណើរការមុននឹង ផ្លាស់ប្តូរសញ្ញាទាំងនោះទៅជាលក្ខណៈពិសេសដែលសាកសមនឹងម៉ូដែល។
ពេលវេលាដំណើរការការសន្និដ្ឋាន ដំណើរការគំរូបង្រួមនៅលើឧបករណ៍ដោយប្រើឧបករណ៍បង្កើនល្បឿននៅពេលមាន។
ដំណើរការក្រោយដំណើរការ ប្រែក្លាយលទ្ធផលទៅជាព្រឹត្តិការណ៍ ស្លាក ឬសកម្មភាពត្រួតពិនិត្យ។
តេឡេមេទ្រី ផ្ទុកឡើងតែអ្វីដែលមានប្រយោជន៍ប៉ុណ្ណោះ៖ សេចក្តីសង្ខេប ភាពមិនប្រក្រតី ឬមតិប្រតិកម្មតាមកាលកំណត់។

ពេលវេលាដំណើរការនៅលើឧបករណ៍ដែលអ្នកនឹងឃើញជាទូទៅរួមមាន LiteRT (ដែលពីមុនហៅថា TensorFlow Lite) របស់ Google, ONNX Runtimeនិង OpenVINO។ ខ្សែសង្វាក់ឧបករណ៍ទាំងនេះច្របាច់បញ្ចូលបរិមាណពីថវិកាថាមពល/អង្គចងចាំដ៏តឹងរ៉ឹងជាមួយនឹងល្បិចដូចជា quantization និងការបញ្ចូលគ្នានៃប្រតិបត្តិករ។ ប្រសិនបើអ្នកចូលចិត្តចំណុចសំខាន់ៗ ឯកសាររបស់ពួកគេគឺរឹងមាំ។ [3][4]

កន្លែងដែលវាបង្ហាញ - ករណីប្រើប្រាស់ពិត អ្នកអាចចង្អុលទៅ 🧯🚗🏭

ការមើលឃើញនៅគែម៖ កាមេរ៉ាកណ្ដឹងទ្វារ (មនុស្សទល់នឹងសត្វចិញ្ចឹម) ការស្កែនលើធ្នើក្នុងហាងលក់រាយ យន្តហោះគ្មានមនុស្សបើកមើលកំហុស។
សំឡេងនៅលើឧបករណ៍៖ ដាស់ពាក្យ ការសរសេរតាមអាន ការរកឃើញលេចធ្លាយនៅក្នុងរុក្ខជាតិ។
IoT ឧស្សាហកម្ម៖ ម៉ូទ័រ និងស្នប់ត្រូវបានត្រួតពិនិត្យសម្រាប់ភាពមិនធម្មតានៃរំញ័រមុនពេលបរាជ័យ។
យានជំនិះ៖ ការត្រួតពិនិត្យអ្នកបើកបរ ការរកឃើញគន្លងផ្លូវ ជំនួយការចតរថយន្ត - វិនាទី ឬបុក។
ការថែទាំសុខភាព: ការពាក់ទង់ជាតិ arrhythmias ក្នុងស្រុក; ធ្វើសមកាលកម្មសង្ខេបនៅពេលក្រោយ។
ស្មាតហ្វូន៖ ការបង្កើនប្រសិទ្ធភាពរូបថត ការរកឃើញការហៅទូរសព្ទឥតបានការ គ្រានៃ "តើទូរស័ព្ទរបស់ខ្ញុំធ្វើវាដោយរបៀបណាក្រៅបណ្តាញ"។

សម្រាប់និយមន័យផ្លូវការ (និង "អ័ព្ទទល់នឹងគែម" ការពិភាក្សាបងប្អូនជីដូនមួយ) សូមមើលគំរូគំនិត NIST ។ [2]

Hardware ដែលធ្វើអោយវាមានភាពរហ័សរហួន🔌

វេទិកាមួយចំនួនត្រូវបានពិនិត្យឈ្មោះជាច្រើន៖

NVIDIA Jetson - ម៉ូឌុលដែលដំណើរការដោយ GPU សម្រាប់មនុស្សយន្ត/កាមេរ៉ា-Swiss-Army-knife vibes សម្រាប់ AI ដែលបានបង្កប់។
Google Edge TPU + LiteRT - ការសន្និដ្ឋានចំនួនគត់ប្រកបដោយប្រសិទ្ធភាព និងពេលវេលាដំណើរការដ៏ងាយស្រួលសម្រាប់គម្រោងថាមពលទាបបំផុត។ [3]
Apple Neural Engine (ANE) - ML នៅលើឧបករណ៍ដ៏តឹងរឹងសម្រាប់ iPhone, iPad និង Mac; ក្រុមហ៊ុន Apple បានបោះពុម្ពផ្សាយការងារជាក់ស្តែងលើការដាក់ពង្រាយ transformers ប្រកបដោយប្រសិទ្ធភាពនៅលើ ANE ។ [5]
CPU/iGPU/NPU របស់ Intel ជាមួយ OpenVINO - “សរសេរម្តង ដាក់ពង្រាយគ្រប់ទីកន្លែង” នៅទូទាំងផ្នែករឹងរបស់ Intel; ការបង្កើនប្រសិទ្ធភាពដែលមានប្រយោជន៍ឆ្លងកាត់។
ONNX Runtime គ្រប់ទីកន្លែង - រយៈពេលដំណើរការអព្យាក្រឹតជាមួយអ្នកផ្តល់ការប្រតិបត្តិដែលអាចដោតបានតាមរយៈទូរស័ព្ទ កុំព្យូទ័រ និងច្រកផ្លូវ។ [4]

តើអ្នកត្រូវការវាទាំងអស់ទេ? មិនពិតទេ។ ជ្រើសរើសផ្លូវដ៏រឹងមាំមួយដែលសមនឹងកងនាវារបស់អ្នក ហើយនៅជាប់នឹងវា - កូរគឺជាសត្រូវនៃក្រុមដែលបានបង្កប់។

ជង់កម្មវិធី - ដំណើរកម្សាន្តខ្លី🧰

ការបង្ហាប់គំរូ៖ បរិមាណ (ជាញឹកញាប់ដល់ int8), ការកាត់ចេញ, ការចម្រាញ់។
ការបង្កើនល្បឿននៃកម្រិតប្រតិបត្តិករ៖ ខឺណែលបានលៃតម្រូវទៅនឹងស៊ីលីកុនរបស់អ្នក។
ពេលវេលាដំណើរការ៖ LiteRT, ONNX Runtime, OpenVINO ។ [3][4]
កញ្ចប់ដាក់ពង្រាយ៖ ធុង/កញ្ចប់កម្មវិធី; ពេលខ្លះសេវាមីក្រូនៅលើច្រកផ្លូវ។
MLOps សម្រាប់គែម៖ ការអាប់ដេតគំរូ OTA, ការដាក់ចេញ A/B, រង្វិលជុំ telemetry ។
ការគ្រប់គ្រងភាពឯកជន និងសុវត្ថិភាព៖ ការអ៊ិនគ្រីបនៅលើឧបករណ៍ ការចាប់ផ្ដើមប្រព័ន្ធដោយសុវត្ថិភាព ការបញ្ជាក់ និងតំបន់ជុំវិញ។

Mini-case៖ ក្រុមត្រួតពិនិត្យយន្តហោះគ្មានមនុស្សបើកមួយបានចម្រាញ់ឧបករណ៍រាវរកទម្ងន់ធ្ងន់ចូលទៅក្នុងគំរូសិស្សបរិមាណសម្រាប់ LiteRT បន្ទាប់មកបញ្ចូល NMS នៅលើឧបករណ៍។ ពេលវេលាហោះហើរបានប្រសើរឡើង ~ 15% ដោយសារការចាប់ឆ្នោតទាប។ កម្រិតសំឡេងផ្ទុកឡើងបានធ្លាក់ចុះដល់ស៊ុមករណីលើកលែង។ (វិធីសាស្រ្ត៖ ការចាប់យកសំណុំទិន្នន័យនៅលើគេហទំព័រ ការក្រិតតាមខ្នាតក្រោយបរិមាណ របៀបស្រមោល A/B មុនពេលការចេញផ្សាយពេញលេញ។ )

តារាងប្រៀបធៀប - ជម្រើស Edge AI ដ៏ពេញនិយម🧪

ការនិយាយពិត៖ តារាងនេះគឺមានការយល់ឃើញ និងមានភាពរញ៉េរញ៉ៃបន្តិច - ដូចជាពិភពលោកពិត។

ឧបករណ៍ / វេទិកា	ទស្សនិកជនល្អបំផុត	តម្លៃប្រកួតប្រជែង	ហេតុអ្វីបានជាវាដំណើរការនៅលើគែម
LiteRT (អតីត TFLite)	ប្រព័ន្ធប្រតិបត្តិការ Android, អ្នកបង្កើត, បង្កប់	$ ទៅ $$	ពេលវេលាដំណើរការគ្មានខ្លាញ់, ឯកសាររឹងមាំ, ឧបករណ៍ចល័តដំបូង។ ដំណើរការក្រៅបណ្តាញយ៉ាងស្អាត។ [3]
រយៈពេលដំណើរការ ONNX	ក្រុមឆ្លងវេទិកា	$	ទម្រង់អព្យាក្រឹត, ផ្នែកខាងក្រោយផ្នែករឹងដែលអាចដោតបាន - ងាយស្រួលសម្រាប់អនាគត។ [4]
OpenVINO	ការដាក់ពង្រាយ Intel-centric	$	កញ្ចប់ឧបករណ៍មួយ គោលដៅ Intel ជាច្រើន; ការបង្កើនប្រសិទ្ធភាពងាយស្រួលឆ្លងកាត់។
NVIDIA Jetson	មនុស្សយន្ត, ចក្ខុវិស័យ - ធ្ងន់	$$ ទៅ $$$	ការបង្កើនល្បឿន GPU នៅក្នុងប្រអប់អាហារថ្ងៃត្រង់; ប្រព័ន្ធអេកូធំទូលាយ។
ផ្លែប៉ោម ANE	កម្មវិធី iOS / iPadOS / macOS	តម្លៃឧបករណ៍	សមាហរណកម្ម HW/SW តឹង; ការងារប្លែង ANE ដែលមានឯកសារយ៉ាងល្អ។ [5]
គែម TPU + LiteRT	គម្រោងថាមពលទាបបំផុត។	$	ការសន្និដ្ឋានប្រកបដោយប្រសិទ្ធភាព int8 នៅគែម; តូចតែមានសមត្ថភាព។ [3]

របៀបជ្រើសរើសផ្លូវ Edge AI - ដើមឈើការសម្រេចចិត្តដ៏តូចមួយ🌳

ជីវិតរបស់អ្នកពិបាកក្នុងពេលវេលាពិត? ចាប់ផ្តើមជាមួយឧបករណ៍បង្កើនល្បឿន + គំរូបរិមាណ។
ប្រភេទឧបករណ៍ជាច្រើន? ពេញចិត្ត ONNX Runtime ឬ OpenVINO សម្រាប់ចល័ត។ [4]
ដឹកជញ្ជូនកម្មវិធីទូរស័ព្ទ? LiteRT គឺជាផ្លូវនៃការតស៊ូតិចបំផុត។ [3]
មនុស្សយន្ត ឬ ការវិភាគកាមេរ៉ា? ប្រតិបត្តិការដែលងាយស្រួលប្រើ GPU របស់ Jetson ជួយសន្សំសំចៃពេលវេលា។
ឥរិយាបថឯកជនភាពតឹងរឹង? រក្សាទិន្នន័យក្នុងមូលដ្ឋាន អ៊ិនគ្រីបនៅពេលសម្រាក កំណត់ហេតុសរុបមិនមែនជាស៊ុមឆៅទេ។
ក្រុមតូច? ជៀសវាងច្រវ៉ាក់ឧបករណ៍កម្រនិងអសកម្ម - គួរឱ្យធុញគឺស្រស់ស្អាត។
ម៉ូដែលនឹងផ្លាស់ប្តូរជាញឹកញាប់? រៀបចំផែនការ OTA និង telemetry ចាប់ពីថ្ងៃដំបូង។

ហានិភ័យ ដែនកំណត់ និងប៊ីតដែលគួរឱ្យធុញ ប៉ុន្តែសំខាន់🧯

គំរូរសាត់ - ការផ្លាស់ប្តូរបរិស្ថាន; តាមដានការចែកចាយ, ដំណើរការរបៀបស្រមោល, ហ្វឹកហាត់ឡើងវិញជាទៀងទាត់។
ការគណនាពិដាន - អង្គចងចាំតឹង / កម្លាំងថាមពលម៉ូដែលតូចជាងឬភាពត្រឹមត្រូវដែលបន្ធូរបន្ថយ។
សុវត្ថិភាព - សន្មត់ការចូលប្រើរាងកាយ; ប្រើការចាប់ផ្ដើមសុវត្ថិភាព វត្ថុបុរាណដែលបានចុះហត្ថលេខា ការបញ្ជាក់ សេវាកម្មដែលមានសិទ្ធិតិចបំផុត។
ការគ្រប់គ្រងទិន្នន័យ - ដំណើរការក្នុងមូលដ្ឋានជួយ ប៉ុន្តែអ្នកនៅតែត្រូវការការយល់ព្រម រក្សា និងពង្រីកវិសាលភាពទូរលេខ។
Fleet ops - ឧបករណ៍ដំណើរការក្រៅបណ្តាញនៅពេលដ៏អាក្រក់បំផុត; រចនាពន្យាការអាប់ដេត និងការបង្ហោះឡើងវិញ។
ការលាយទេពកោសល្យ - បង្កប់ + ML + DevOps គឺជានាវិក motley; រថភ្លើងឆ្លងកាត់មុន។

ផែនទីបង្ហាញផ្លូវជាក់ស្តែងដើម្បីដឹកជញ្ជូនរបស់ដែលមានប្រយោជន៍🗺️

ជ្រើសរើសករណីប្រើប្រាស់មួយ ជាមួយនឹងការរកឃើញកំហុសតម្លៃដែលអាចវាស់វែងបាននៅលើបន្ទាត់ទី 3 ការដាស់ពាក្យនៅលើឧបករណ៍បំពងសំឡេងឆ្លាតវៃ។ល។
ប្រមូលសំណុំទិន្នន័យយ៉ាងម៉ត់ចត់ ដែលឆ្លុះបញ្ចាំងពីបរិយាកាសគោលដៅ។ ចាក់សំលេងរំខានដើម្បីផ្គូផ្គងការពិត។
គំរូដើមនៅលើឧបករណ៍អភិវឌ្ឍន៍ ដែលនៅជិតផ្នែករឹងផលិតកម្ម។
បង្រួមគំរូ ជាមួយនឹងបរិមាណ / កាត់ចេញ; វាស់វែងការបាត់បង់ភាពត្រឹមត្រូវដោយស្មោះត្រង់។ [3]
រុំការសន្និដ្ឋាននៅក្នុង API ស្អាត ជាមួយ backpressure និង watchdogs ពីព្រោះឧបករណ៍ព្យួរនៅម៉ោង 2 ព្រឹក
រចនាទូរលេខ ដែលគោរពភាពឯកជន៖ ផ្ញើចំនួន អ៊ីស្តូក្រាម លក្ខណៈពិសេសដែលស្រង់ចេញពីគែម។
ពង្រឹងសុវត្ថិភាព៖ ប្រព័ន្ធគោលពីរដែលបានចុះហត្ថលេខា ការចាប់ផ្ដើមសុវត្ថិភាព សេវាកម្មតិចតួចបំផុតបើក។
ផែនការ OTA៖ ការចេញដំណើរដ៏គួរឱ្យភ្ញាក់ផ្អើល, Canaries, ការវិលត្រឡប់មកវិញភ្លាមៗ។
សាកល្បងក្នុងប្រអប់ជ្រុងដ៏រញ៉េរញ៉ៃ ជាមុនសិន - ប្រសិនបើវានៅរស់រានមានជីវិតនៅទីនោះ វានឹងនៅរស់រានមានជីវិតនៅគ្រប់ទីកន្លែង។
ធ្វើមាត្រដ្ឋានជាមួយសៀវភៅណែនាំ៖ របៀបដែលអ្នកនឹងបន្ថែមម៉ូដែល បង្វិលគ្រាប់ចុច រក្សាទុកទិន្នន័យ - ដូច្នេះគម្រោងទី 2 មិនមែនជាភាពវឹកវរទេ។

សំណួរដែលសួរញឹកញាប់ - ចម្លើយខ្លីៗចំពោះ អ្វីដែលជាអាថ៌កំបាំងរបស់ Edge AI ❓

តើ Edge AI គ្រាន់តែដំណើរការគំរូតូចមួយនៅលើកុំព្យូទ័រតូចមួយមែនទេ?
ភាគច្រើន បាទ/ចាស៎ - ប៉ុន្តែទំហំមិនមែនជារឿងទាំងមូលនោះទេ។ វាក៏និយាយអំពីថវិកាសម្រាប់ភាពយឺតយ៉ាវ ការសន្យាអំពីភាពឯកជន និងការរៀបចំឧបករណ៍ជាច្រើនដែលដំណើរការនៅក្នុងស្រុក ប៉ុន្តែកំពុងរៀននៅទូទាំងពិភពលោក។ [1]

តើខ្ញុំអាចហ្វឹកហាត់នៅគែមដែរទេ?
ការហ្វឹកហាត់/ការកំណត់ផ្ទាល់ខ្លួននៅលើឧបករណ៍ដែលមានទម្ងន់ស្រាលមាន។ ការហ្វឹកហាត់ធ្ងន់ជាងនៅតែដំណើរការនៅកណ្តាល។ ONNX Runtime កត់ត្រាជម្រើសហ្វឹកហាត់នៅលើឧបករណ៍ ប្រសិនបើអ្នកចូលចិត្តផ្សងព្រេង។ [4]

តើ Edge AI vs Fog Computing ជាអ្វី?
អ័ព្ទនិងគែមគឺជាបងប្អូនជីដូនមួយ ទាំងពីរនាំការគណនាកាន់តែខិតទៅជិតប្រភពទិន្នន័យ ជួនកាលតាមរយៈច្រកផ្លូវក្បែរនោះ។ សម្រាប់និយមន័យ និងបរិបទផ្លូវការ សូមមើល NIST ។ [2]

តើ Edge AI តែងតែធ្វើអោយប្រសើរឡើងនូវភាពឯកជនដែរឬទេ?
វាជួយបាន - ប៉ុន្តែវាមិនមែនជាមន្តអាគមទេ។ អ្នកនៅតែត្រូវការការបង្រួមអប្បបរមា ផ្លូវធ្វើបច្ចុប្បន្នភាពដែលមានសុវត្ថិភាព និងការកត់ត្រាដោយប្រុងប្រយ័ត្ន។ ចាត់ទុកភាពឯកជនជាទម្លាប់ មិនមែនជាប្រអប់ធីកទេ។

ការជ្រមុជទឹកជ្រៅដែលអ្នកពិតជាអាចអាន📚

1) ការបង្កើនប្រសិទ្ធភាពគំរូដែលមិនធ្វើឱ្យខូចភាពត្រឹមត្រូវ

Quantization អាចកាត់បន្ថយអង្គចងចាំ និងបង្កើនល្បឿន ops ប៉ុន្តែការក្រិតតាមខ្នាតជាមួយទិន្នន័យតំណាង ឬគំរូអាចធ្វើអោយសត្វកំប្រុកយល់ច្រឡំនៅកន្លែងដែលមានកោណចរាចរណ៍។ Distillation-គ្រូណែនាំសិស្សតូច-ច្រើនតែរក្សាអត្ថន័យ។ [3]

2) គែមនៃការរត់ការសន្និដ្ឋាននៅក្នុងការអនុវត្ត

អ្នកបកប្រែរបស់ LiteRT មានចេតនាបង្កើតអង្គចងចាំតិចដោយចេតនានៅពេលដំណើរការ។ ONNX Runtime ដោតចូលទៅក្នុងឧបករណ៍បង្កើនល្បឿនផ្សេងៗតាមរយៈអ្នកផ្តល់ការប្រតិបត្តិ។ ទាំងគ្រាប់កាំភ្លើងមិនមែនជាប្រាក់; ទាំងពីរគឺជាញញួររឹង។ [3][4]

3) ភាពរឹងមាំនៅក្នុងព្រៃ

កំដៅ ធូលី ថាមពលមិនប្រក្រតី slapdash Wi-Fi៖ បង្កើតឧបករណ៍ឃ្លាំមើលដែលចាប់ផ្តើមបំពង់ឡើងវិញ ការសម្រេចចិត្តក្នុងឃ្លាំងសម្ងាត់ និងផ្សះផ្សានៅពេលដែលបណ្តាញត្រឡប់មកវិញ។ ភាពទាក់ទាញតិចជាងការយកចិត្តទុកដាក់ - សំខាន់ជាង។

ឃ្លាដែលអ្នកនឹងនិយាយម្តងទៀតនៅក្នុងកិច្ចប្រជុំ - តើ Edge AI ជាអ្វី 🗣️

Edge AI ផ្លាស់ទីភាពវៃឆ្លាតឱ្យខិតទៅជិតទិន្នន័យ ដើម្បីបំពេញតាមឧបសគ្គជាក់ស្តែងនៃភាពយឺតយ៉ាវ ភាពឯកជន កម្រិតបញ្ជូន និងភាពជឿជាក់។ វេទមន្តមិនមែនជាបន្ទះឈីបមួយឬក្របខណ្ឌនោះទេ វាកំពុងតែជ្រើសរើសយ៉ាងឆ្លាតវៃនូវអ្វីដែលត្រូវគណនាពីកន្លែងណា។

សុន្ទរកថាចុងក្រោយ - វែងពេក ខ្ញុំមិនបានអានវា🧵

Edge AI ដំណើរការម៉ូដែលនៅជិតទិន្នន័យ ដូច្នេះផលិតផលមានអារម្មណ៍ថាលឿន ឯកជន និងរឹងមាំ។ អ្នកនឹងលាយបញ្ចូលគ្នានូវការសន្និដ្ឋានក្នុងស្រុកជាមួយនឹងការត្រួតពិនិត្យលើពពកសម្រាប់ពិភពលោកទាំងពីរដ៏ល្អបំផុត។ ជ្រើសរើសពេលវេលាដំណើរការដែលត្រូវនឹងឧបករណ៍របស់អ្នក ពឹងផ្អែកលើឧបករណ៍បង្កើនល្បឿននៅពេលដែលអ្នកអាចធ្វើបាន រក្សាម៉ូដែលឱ្យមានរបៀបរៀបរយជាមួយនឹងការបង្ហាប់ និងរចនាប្រតិបត្តិការកងនាវាដូចជាការងាររបស់អ្នកអាស្រ័យលើវា - ពីព្រោះវាអាច។ ប្រសិនបើនរណាម្នាក់សួរថា Edge AI ជាអ្វីសូមនិយាយថា៖ ការសម្រេចចិត្តឆ្លាតវៃ ធ្វើឡើងនៅក្នុងស្រុក ទាន់ពេលវេលា។ បន្ទាប់មកញញឹម ហើយប្តូរប្រធានបទទៅជាថ្ម។ 🔋🙂

ឯកសារយោង

IBM - តើ Edge AI ជាអ្វី? (និយមន័យ, អត្ថប្រយោជន៍) ។
https://www.ibm.com/think/topics/edge-ai
NIST - SP 500-325: Fog Computing Conceptual Model (បរិបទផ្លូវការសម្រាប់អ័ព្ទ/គែម)។
https://csrc.nist.gov/pubs/sp/500/325/final
Google AI Edge - LiteRT (ពីមុន TensorFlow Lite) (ពេលដំណើរការ បរិមាណ ការធ្វើចំណាកស្រុក)។
https://ai.google.dev/edge/litert
ONNX Runtime - ការបណ្តុះបណ្តាលលើឧបករណ៍ (ពេលរត់ចល័ត + ការហ្វឹកហាត់នៅលើឧបករណ៍គែម)។
https://onnxruntime.ai/docs/get-started/training-on-device.html
Apple Machine Learning Research - ការដាក់ពង្រាយ Transformers នៅលើ Apple Neural Engine (ANE efficiency notes)។
https://machinelearning.apple.com/research/neural-engine-transformers

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ