Edge AI ជំរុញការស៊ើបការណ៍សម្ងាត់ទៅកាន់កន្លែងដែលទិន្នន័យកើត។ វាស្តាប់ទៅដូចជាស្រើបស្រាល ប៉ុន្តែគំនិតស្នូលគឺសាមញ្ញ៖ ធ្វើការគិតនៅជាប់នឹងឧបករណ៍ចាប់សញ្ញា ដូច្នេះលទ្ធផលនឹងបង្ហាញឡើងឥឡូវនេះ មិនមែននៅពេលក្រោយទេ។ អ្នកទទួលបានល្បឿន ភាពអាចជឿជាក់បាន និងរឿងរ៉ាវឯកជនភាពសមរម្យដោយមិនចាំបាច់មានអ្នកមើលថែទាំក្មេងគ្រប់ការសម្រេចចិត្ត។ ចូរស្រាយវាចេញ - ផ្លូវកាត់ និងដំណើរស្វែងរកចំហៀងរួមបញ្ចូល។ 😅
អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖
🔗 តើអ្វីទៅជា AI ជំនាន់
ការពន្យល់ច្បាស់លាស់នៃ AI ជំនាន់មុន របៀបដែលវាដំណើរការ និងការប្រើប្រាស់ជាក់ស្តែង។
🔗 តើអ្វីទៅជាភ្នាក់ងារ AI
ទិដ្ឋភាពទូទៅនៃភ្នាក់ងារ AI ឥរិយាបថស្វយ័ត និងគំរូកម្មវិធីក្នុងពិភពពិត។
🔗 តើអ្វីទៅជា AI ធ្វើមាត្រដ្ឋាន
ស្វែងយល់ពីរបៀបធ្វើមាត្រដ្ឋានប្រព័ន្ធ AI ប្រកបដោយភាពជឿជាក់ ប្រសិទ្ធភាព និងការចំណាយប្រកបដោយប្រសិទ្ធភាព។
🔗 អ្វីទៅជាក្របខ័ណ្ឌកម្មវិធីសម្រាប់ AI
ការបំបែកក្របខ័ណ្ឌកម្មវិធី AI អត្ថប្រយោជន៍ស្ថាបត្យកម្ម និងមូលដ្ឋានគ្រឹះនៃការអនុវត្ត។
តើ Edge AI ជាអ្វី? និយមន័យរហ័ស 🧭
Edge AI គឺជាការអនុវត្តនៃការដំណើរការម៉ូដែលរៀនម៉ាស៊ីនដែលបានបណ្តុះបណ្តាលដោយផ្ទាល់នៅលើ ឬនៅជិតឧបករណ៍ដែលប្រមូលទិន្នន័យ ទូរស័ព្ទ កាមេរ៉ា មនុស្សយន្ត រថយន្ត ឧបករណ៍ពាក់ ឧបករណ៍បញ្ជាឧស្សាហកម្ម ដែលអ្នកដាក់ឈ្មោះវា។ ជំនួសឱ្យការដឹកជញ្ជូនទិន្នន័យឆៅទៅកាន់ម៉ាស៊ីនមេឆ្ងាយសម្រាប់ការវិភាគ ឧបករណ៍ដំណើរការបញ្ចូលក្នុងមូលដ្ឋាន ហើយផ្ញើតែសេចក្តីសង្ខេប ឬគ្មានអ្វីទាំងអស់។ ការធ្វើដំណើរទៅមកតិចជាង ភាពយឺតយ៉ាវតិច ការគ្រប់គ្រងកាន់តែច្រើន។ ប្រសិនបើអ្នកចង់បានអ្នកពន្យល់អ្នកលក់ស្អាត ចាប់ផ្តើមនៅទីនេះ។ [1]

តើអ្វីដែលធ្វើឱ្យ Edge AI ពិតជាមានប្រយោជន៍? 🌟
-
ភាពយឺតយ៉ាវទាប - ការសម្រេចចិត្តកើតឡើងនៅលើឧបករណ៍ ដូច្នេះការឆ្លើយតបនឹងមានអារម្មណ៍ភ្លាមៗសម្រាប់កិច្ចការនៃការយល់ឃើញ ដូចជាការរកឃើញវត្ថុ ការដាស់ពាក្យ ឬការជូនដំណឹងអំពីភាពមិនប្រក្រតី។ [1]
-
ភាពឯកជនតាមតំបន់ - ទិន្នន័យរសើបអាចស្ថិតនៅលើឧបករណ៍ កាត់បន្ថយការប៉ះពាល់ និងជួយក្នុងការពិភាក្សាកាត់បន្ថយទិន្នន័យ។ [1]
-
ការសន្សំកម្រិតបញ្ជូន - ផ្ញើលក្ខណៈពិសេស ឬព្រឹត្តិការណ៍ជំនួសឱ្យស្ទ្រីមឆៅ។ [1]
-
ភាពធន់ - ដំណើរការក្នុងអំឡុងពេលភ្ជាប់ស្គ្រីប។
-
ការគ្រប់គ្រងថ្លៃដើម - វដ្តគណនាពពកតិចជាងមុន និងដំណើរការទាប។
-
ការយល់ដឹងអំពីបរិបទ - ឧបករណ៍ "មានអារម្មណ៍ថា" បរិស្ថាននិងសម្របខ្លួន។
សង្ខេបខ្លីៗ៖ អ្នកបើកយន្តហោះលក់រាយបានផ្លាស់ប្តូរការបង្ហោះកាមេរ៉ាថេរសម្រាប់ការចាត់ថ្នាក់មនុស្សទល់នឹងវត្ថុនៅលើឧបករណ៍ ហើយបានជំរុញតែការរាប់ម៉ោង និងឈុតលើកលែងប៉ុណ្ណោះ។ លទ្ធផល៖ ការដាស់តឿនរង 200 ms នៅគែមធ្នើ និង ~ 90% ធ្លាក់ចុះក្នុងចរាចរណ៍ឡើងលើ-ដោយមិនផ្លាស់ប្តូរកិច្ចសន្យា WAN ហាង។ (វិធីសាស្រ្ត៖ ការសន្និដ្ឋានក្នុងស្រុក ការប្រមូលព្រឹត្តិការណ៍ ភាពមិនប្រក្រតីតែប៉ុណ្ណោះ។ )
Edge AI vs cloud AI - កម្រិតពណ៌រហ័ស🥊
-
កន្លែងដែលការគណនាកើតឡើង : edge = on-device/near-device; ពពក = មជ្ឈមណ្ឌលទិន្នន័យពីចម្ងាយ។
-
ភាពយឺតយ៉ាវ ៖ គែម≈ពេលវេលាពិត; ពពកមានការធ្វើដំណើរជុំវិញ។
-
ចលនាទិន្នន័យ ៖ តម្រងគែម/បង្ហាប់ជាមុនសិន; cloud ចូលចិត្តការបង្ហោះដែលមានភាពស្មោះត្រង់ពេញលេញ។
-
ភាពជឿជាក់ ៖ គែមបន្តដំណើរការក្រៅបណ្តាញ។ ពពកត្រូវការការតភ្ជាប់។
-
អភិបាលកិច្ច : edge គាំទ្រការបង្រួមទិន្នន័យ។ ពពកធ្វើការត្រួតពិនិត្យជាកណ្តាល។ [1]
វាមិនមែនទាំងឬក៏អត់។ ប្រព័ន្ធឆ្លាតវៃរួមបញ្ចូលគ្នាទាំងពីរ៖ ការសម្រេចចិត្តរហ័សក្នុងមូលដ្ឋាន ការវិភាគកាន់តែស៊ីជម្រៅ និងការរៀនកងនាវានៅកណ្តាល។ ចម្លើយកូនកាត់គឺគួរឱ្យធុញ និងត្រឹមត្រូវ។
របៀបដែល Edge AI ពិតជាដំណើរការនៅក្រោមក្រណាត់🧩
-
ឧបករណ៍ចាប់សញ្ញា ចាប់យកសញ្ញាឆៅ-ស៊ុមអូឌីយ៉ូ, ភីកសែលកាមេរ៉ា, ការប៉ះ IMU, ដានរំញ័រ។
-
ដំណើរការមុននឹង ផ្លាស់ប្តូរសញ្ញាទាំងនោះទៅជាលក្ខណៈពិសេសដែលសាកសមនឹងម៉ូដែល។
-
ពេលវេលាដំណើរការការសន្និដ្ឋាន ដំណើរការគំរូបង្រួមនៅលើឧបករណ៍ដោយប្រើឧបករណ៍បង្កើនល្បឿននៅពេលមាន។
-
ដំណើរការក្រោយដំណើរការ ប្រែក្លាយលទ្ធផលទៅជាព្រឹត្តិការណ៍ ស្លាក ឬសកម្មភាពត្រួតពិនិត្យ។
-
Telemetry បង្ហោះតែអ្វីដែលមានប្រយោជន៍៖ សេចក្តីសង្ខេប ភាពមិនប្រក្រតី ឬមតិកែលម្អតាមកាលកំណត់។
ពេលវេលាដំណើរការនៅលើឧបករណ៍ដែលអ្នកនឹងឃើញនៅក្នុងធម្មជាតិរួមមាន LiteRT (ពីមុន TensorFlow Lite), ONNX Runtime និង OpenVINO ។ ខ្សែសង្វាក់ឧបករណ៍ទាំងនេះច្របាច់បញ្ចូលពីថវិកាថាមពល/អង្គចងចាំដ៏តឹងរឹង ជាមួយនឹងល្បិចដូចជា quantization និង operator fusion។ ប្រសិនបើអ្នកចូលចិត្តគ្រាប់ និងប៊ូឡុង ឯកសាររបស់ពួកគេគឺរឹង។ [3][4]
កន្លែងដែលវាបង្ហាញ - ករណីប្រើប្រាស់ពិត អ្នកអាចចង្អុលទៅ 🧯🚗🏭
-
ការមើលឃើញនៅគែម ៖ កាមេរ៉ាកណ្ដឹងទ្វារ (មនុស្សទល់នឹងសត្វចិញ្ចឹម) ការស្កែនលើធ្នើក្នុងហាងលក់រាយ យន្តហោះគ្មានមនុស្សបើកមើលកំហុស។
-
សំឡេងនៅលើឧបករណ៍ ៖ ដាស់ពាក្យ ការសរសេរតាមអាន ការរកឃើញលេចធ្លាយនៅក្នុងរុក្ខជាតិ។
-
IoT ឧស្សាហកម្ម ៖ ម៉ូទ័រ និងស្នប់ត្រូវបានត្រួតពិនិត្យសម្រាប់ភាពមិនធម្មតានៃរំញ័រមុនពេលបរាជ័យ។
-
យានជំនិះ ៖ ការត្រួតពិនិត្យអ្នកបើកបរ ការរកឃើញគន្លងផ្លូវ ជំនួយការចតរថយន្ត - វិនាទី ឬបុក។
-
ការថែទាំសុខភាព : ការពាក់ទង់ជាតិ arrhythmias ក្នុងស្រុក; ធ្វើសមកាលកម្មសង្ខេបនៅពេលក្រោយ។
-
ស្មាតហ្វូន ៖ ការកែលម្អរូបថត ការរកឃើញសារឥតបានការ ការហៅទូរសព្ទ “តើទូរសព្ទរបស់ខ្ញុំធ្វើដោយរបៀបណាពេលគ្មានអ៊ីនធឺណិត”។
សម្រាប់និយមន័យផ្លូវការ (និង "អ័ព្ទទល់នឹងគែម" ការពិភាក្សាបងប្អូនជីដូនមួយ) សូមមើលគំរូគំនិត NIST ។ [2]
Hardware ដែលធ្វើអោយវាមានភាពរហ័សរហួន🔌
វេទិកាមួយចំនួនត្រូវបានពិនិត្យឈ្មោះជាច្រើន៖
-
NVIDIA Jetson - ម៉ូឌុលដែលដំណើរការដោយ GPU សម្រាប់មនុស្សយន្ត/កាមេរ៉ា-Swiss-Army-knife vibes សម្រាប់ AI ដែលបានបង្កប់។
-
Google Edge TPU + LiteRT - ការសន្និដ្ឋានចំនួនគត់ប្រកបដោយប្រសិទ្ធភាព និងពេលវេលាដំណើរការដ៏ងាយស្រួលសម្រាប់គម្រោងថាមពលទាបបំផុត។ [3]
-
Apple Neural Engine (ANE) - ML នៅលើឧបករណ៍ដ៏តឹងរឹងសម្រាប់ iPhone, iPad និង Mac; ក្រុមហ៊ុន Apple បានបោះពុម្ពផ្សាយការងារជាក់ស្តែងលើការដាក់ពង្រាយ transformers ប្រកបដោយប្រសិទ្ធភាពនៅលើ ANE ។ [5]
-
ស៊ីភីយូ Intel / iGPUs / NPUs ជាមួយ OpenVINO - "សរសេរម្តង ដាក់ពង្រាយគ្រប់ទីកន្លែង" នៅលើផ្នែករឹងរបស់ Intel; ការបង្កើនប្រសិទ្ធភាពដែលមានប្រយោជន៍ឆ្លងកាត់។
-
ONNX Runtime គ្រប់ទីកន្លែង - រយៈពេលដំណើរការអព្យាក្រឹតជាមួយអ្នកផ្តល់ការប្រតិបត្តិដែលអាចដោតបានតាមរយៈទូរស័ព្ទ កុំព្យូទ័រ និងច្រកផ្លូវ។ [4]
តើអ្នកត្រូវការវាទាំងអស់ទេ? មិនពិតទេ។ ជ្រើសរើសផ្លូវដ៏រឹងមាំមួយដែលសមនឹងកងនាវារបស់អ្នក ហើយនៅជាប់នឹងវា - កូរគឺជាសត្រូវនៃក្រុមដែលបានបង្កប់។
ជង់កម្មវិធី - ដំណើរកម្សាន្តខ្លី🧰
-
ការបង្ហាប់គំរូ ៖ បរិមាណ (ជាញឹកញាប់ដល់ int8), ការកាត់ចេញ, ការចម្រាញ់។
-
ការបង្កើនល្បឿននៃកម្រិតប្រតិបត្តិករ ៖ ខឺណែលបានលៃតម្រូវទៅនឹងស៊ីលីកុនរបស់អ្នក។
-
ពេលវេលាដំណើរការ ៖ LiteRT, ONNX Runtime, OpenVINO ។ [3][4]
-
កញ្ចប់ដាក់ពង្រាយ ៖ ធុង/កញ្ចប់កម្មវិធី; ពេលខ្លះសេវាមីក្រូនៅលើច្រកផ្លូវ។
-
MLOps សម្រាប់គែម ៖ ការអាប់ដេតគំរូ OTA, ការដាក់ចេញ A/B, រង្វិលជុំ telemetry ។
-
ការគ្រប់គ្រងភាពឯកជន និងសុវត្ថិភាព ៖ ការអ៊ិនគ្រីបនៅលើឧបករណ៍ ការចាប់ផ្ដើមសុវត្ថិភាព ការបញ្ជាក់ ការភ្ជាប់។
Mini-case៖ ក្រុមត្រួតពិនិត្យយន្តហោះគ្មានមនុស្សបើកមួយបានចម្រាញ់ឧបករណ៍រាវរកទម្ងន់ធ្ងន់ចូលទៅក្នុងគំរូសិស្សបរិមាណសម្រាប់ LiteRT បន្ទាប់មកបញ្ចូល NMS នៅលើឧបករណ៍។ ពេលវេលាហោះហើរបានប្រសើរឡើង ~ 15% ដោយសារការចាប់ឆ្នោតទាប។ កម្រិតសំឡេងផ្ទុកឡើងបានធ្លាក់ចុះដល់ស៊ុមករណីលើកលែង។ (វិធីសាស្រ្ត៖ ការចាប់យកសំណុំទិន្នន័យនៅលើគេហទំព័រ ការក្រិតតាមខ្នាតក្រោយបរិមាណ របៀបស្រមោល A/B មុនពេលការចេញផ្សាយពេញលេញ។ )
តារាងប្រៀបធៀប - ជម្រើស Edge AI ដ៏ពេញនិយម🧪
ការនិយាយពិត៖ តារាងនេះគឺមានការយល់ឃើញ និងមានភាពរញ៉េរញ៉ៃបន្តិច - ដូចជាពិភពលោកពិត។
| ឧបករណ៍ / វេទិកា | ទស្សនិកជនល្អបំផុត | តម្លៃប្រកួតប្រជែង | ហេតុអ្វីបានជាវាដំណើរការនៅលើគែម |
|---|---|---|---|
| LiteRT (អតីត TFLite) | ប្រព័ន្ធប្រតិបត្តិការ Android, អ្នកបង្កើត, បង្កប់ | $ ទៅ $$ | ពេលវេលាដំណើរការគ្មានខ្លាញ់, ឯកសាររឹងមាំ, ឧបករណ៍ចល័តដំបូង។ ដំណើរការក្រៅបណ្តាញយ៉ាងស្អាត។ [3] |
| រយៈពេលដំណើរការ ONNX | ក្រុមឆ្លងវេទិកា | $ | ទម្រង់អព្យាក្រឹត, ផ្នែកខាងក្រោយផ្នែករឹងដែលអាចដោតបាន - ងាយស្រួលសម្រាប់អនាគត។ [4] |
| OpenVINO | ការដាក់ពង្រាយ Intel-centric | $ | កញ្ចប់ឧបករណ៍មួយ គោលដៅ Intel ជាច្រើន; ការបង្កើនប្រសិទ្ធភាពងាយស្រួលឆ្លងកាត់។ |
| NVIDIA Jetson | មនុស្សយន្ត, ចក្ខុវិស័យ - ធ្ងន់ | $$ ទៅ $$$ | ការបង្កើនល្បឿន GPU នៅក្នុងប្រអប់អាហារថ្ងៃត្រង់; ប្រព័ន្ធអេកូធំទូលាយ។ |
| ផ្លែប៉ោម ANE | កម្មវិធី iOS / iPadOS / macOS | តម្លៃឧបករណ៍ | សមាហរណកម្ម HW/SW តឹង; ការងារប្លែង ANE ដែលមានឯកសារយ៉ាងល្អ។ [5] |
| គែម TPU + LiteRT | គម្រោងថាមពលទាបបំផុត។ | $ | ការសន្និដ្ឋានប្រកបដោយប្រសិទ្ធភាព int8 នៅគែម; តូចតែមានសមត្ថភាព។ [3] |
របៀបជ្រើសរើសផ្លូវ Edge AI - ដើមឈើការសម្រេចចិត្តដ៏តូចមួយ🌳
-
ជីវិតរបស់អ្នកពិបាកក្នុងពេលវេលាពិត? ចាប់ផ្តើមជាមួយឧបករណ៍បង្កើនល្បឿន + គំរូបរិមាណ។
-
ប្រភេទឧបករណ៍ជាច្រើន? ពេញចិត្ត ONNX Runtime ឬ OpenVINO សម្រាប់ចល័ត។ [4]
-
ដឹកជញ្ជូនកម្មវិធីទូរស័ព្ទ? LiteRT គឺជាផ្លូវនៃការតស៊ូតិចបំផុត។ [3]
-
មនុស្សយន្ត ឬការវិភាគកាមេរ៉ា? មុខងារដែលងាយស្រួលប្រើ GPU របស់ Jetson ចំណេញពេលវេលា។
-
ឥរិយាបថឯកជនភាពតឹងរឹង? រក្សាទិន្នន័យក្នុងមូលដ្ឋាន អ៊ិនគ្រីបនៅពេលសម្រាក កំណត់ហេតុសរុបមិនមែនជាស៊ុមឆៅទេ។
-
ក្រុមតូច? ជៀសវាងច្រវ៉ាក់ឧបករណ៍កម្រនិងអសកម្ម - គួរឱ្យធុញគឺស្រស់ស្អាត។
-
ម៉ូដែលនឹងផ្លាស់ប្តូរជាញឹកញាប់? រៀបចំផែនការ OTA និង telemetry ចាប់ពីថ្ងៃដំបូង។
ហានិភ័យ ដែនកំណត់ និងប៊ីតដែលគួរឱ្យធុញ ប៉ុន្តែសំខាន់🧯
-
គំរូរសាត់ - ការផ្លាស់ប្តូរបរិស្ថាន; តាមដានការចែកចាយ, ដំណើរការរបៀបស្រមោល, ហ្វឹកហាត់ឡើងវិញជាទៀងទាត់។
-
ការគណនាពិដាន - អង្គចងចាំតឹង / កម្លាំងថាមពលម៉ូដែលតូចជាងឬភាពត្រឹមត្រូវដែលបន្ធូរបន្ថយ។
-
សុវត្ថិភាព - សន្មត់ការចូលប្រើរាងកាយ; ប្រើការចាប់ផ្ដើមសុវត្ថិភាព វត្ថុបុរាណដែលបានចុះហត្ថលេខា ការបញ្ជាក់ សេវាកម្មដែលមានសិទ្ធិតិចបំផុត។
-
ការគ្រប់គ្រងទិន្នន័យ - ដំណើរការក្នុងមូលដ្ឋានជួយ ប៉ុន្តែអ្នកនៅតែត្រូវការការយល់ព្រម រក្សា និងពង្រីកវិសាលភាពទូរលេខ។
-
Fleet ops - ឧបករណ៍ដំណើរការក្រៅបណ្តាញនៅពេលដ៏អាក្រក់បំផុត; រចនាពន្យាការអាប់ដេត និងការបង្ហោះឡើងវិញ។
-
ការលាយទេពកោសល្យ - បង្កប់ + ML + DevOps គឺជានាវិក motley; រថភ្លើងឆ្លងកាត់មុន។
ផែនទីបង្ហាញផ្លូវជាក់ស្តែងដើម្បីដឹកជញ្ជូនរបស់ដែលមានប្រយោជន៍🗺️
-
ជ្រើសរើសករណីប្រើប្រាស់មួយ ជាមួយនឹងការរកឃើញកំហុសតម្លៃដែលអាចវាស់វែងបាននៅលើបន្ទាត់ទី 3 ការដាស់ពាក្យនៅលើឧបករណ៍បំពងសំឡេងឆ្លាតវៃ។ល។
-
ប្រមូលសំណុំទិន្នន័យយ៉ាងម៉ត់ចត់ ដែលឆ្លុះបញ្ចាំងពីបរិយាកាសគោលដៅ។ ចាក់សំលេងរំខានដើម្បីផ្គូផ្គងការពិត។
-
គំរូដើមនៅលើឧបករណ៍អភិវឌ្ឍន៍ ដែលនៅជិតផ្នែករឹងផលិតកម្ម។
-
បង្រួមគំរូ ជាមួយនឹងបរិមាណ / កាត់ចេញ; វាស់វែងការបាត់បង់ភាពត្រឹមត្រូវដោយស្មោះត្រង់។ [3]
-
រុំការសន្និដ្ឋាននៅក្នុង API ស្អាត ជាមួយ backpressure និង watchdogs ពីព្រោះឧបករណ៍ព្យួរនៅម៉ោង 2 ព្រឹក
-
រចនាទូរលេខ ដែលគោរពភាពឯកជន៖ ផ្ញើចំនួន អ៊ីស្តូក្រាម លក្ខណៈពិសេសដែលស្រង់ចេញពីគែម។
-
ពង្រឹងសុវត្ថិភាព ៖ ប្រព័ន្ធគោលពីរដែលបានចុះហត្ថលេខា ការចាប់ផ្ដើមសុវត្ថិភាព សេវាកម្មតិចតួចបំផុតបើក។
-
ផែនការ OTA ៖ ការចេញដំណើរដ៏គួរឱ្យភ្ញាក់ផ្អើល, Canaries, ការវិលត្រឡប់មកវិញភ្លាមៗ។
-
អ្នកបើកយន្តហោះនៅក្នុងករណីដ៏អាក្រក់មួយ ជាមុនសិន ប្រសិនបើវារស់នៅទីនោះ វានឹងរស់បានគ្រប់ទីកន្លែង។
-
ធ្វើមាត្រដ្ឋានជាមួយសៀវភៅលេង ៖ របៀបដែលអ្នកនឹងបន្ថែមម៉ូដែល បង្វិលសោ រក្សាទុកទិន្នន័យ ដូច្នេះគម្រោង #2 មិនមែនជារឿងច្របូកច្របល់ទេ។
សំណួរគេសួរញឹកញាប់ - ចម្លើយខ្លីចំពោះ អ្វីដែល Edge AI ចង់ដឹងចង់ឃើញ ❓
តើ Edge AI គ្រាន់តែដំណើរការគំរូតូចមួយនៅលើកុំព្យូទ័រដ៏តូចមែនទេ?
ភាគច្រើន បាទ-ប៉ុន្តែទំហំមិនមែនជារឿងទាំងមូលទេ។ វាក៏និយាយអំពីថវិកាពេលយឺតយ៉ាវ ការសន្យាឯកជនភាព និងការចាត់ចែងឧបករណ៍ជាច្រើនដែលដំណើរការនៅក្នុងមូលដ្ឋាន ប៉ុន្តែកំពុងសិក្សានៅទូទាំងពិភពលោក។ [1]
តើខ្ញុំអាចហ្វឹកហាត់នៅលើគែមបានទេ?
មានការហ្វឹកហ្វឺនលើឧបករណ៍ទម្ងន់ស្រាល/ការកំណត់ផ្ទាល់ខ្លួន។ ការហ្វឹកហ្វឺនដែលធ្ងន់ជាងនេះនៅតែដំណើរការនៅកណ្តាល។ ONNX Runtime ឯកសារជម្រើសបណ្តុះបណ្តាលនៅលើឧបករណ៍ ប្រសិនបើអ្នកជាអ្នកផ្សងព្រេង។ [4]
តើ Edge AI vs Fog Computing ជាអ្វី?
អ័ព្ទនិងគែមគឺជាបងប្អូនជីដូនមួយ ទាំងពីរនាំការគណនាកាន់តែខិតទៅជិតប្រភពទិន្នន័យ ជួនកាលតាមរយៈច្រកផ្លូវក្បែរនោះ។ សម្រាប់និយមន័យ និងបរិបទផ្លូវការ សូមមើល NIST ។ [2]
តើ Edge AI តែងតែកែលម្អភាពឯកជនដែរឬទេ?
វាជួយ - ប៉ុន្តែវាមិនមែនជាវេទមន្តទេ។ អ្នកនៅតែត្រូវការការបង្រួមអប្បបរមា ផ្លូវធ្វើបច្ចុប្បន្នភាពសុវត្ថិភាព និងការកត់ត្រាដោយប្រុងប្រយ័ត្ន។ ចាត់ទុកភាពឯកជនជាទម្លាប់ មិនមែនជាប្រអប់ធីកទេ។
ការជ្រមុជទឹកជ្រៅដែលអ្នកពិតជាអាចអាន📚
1) ការបង្កើនប្រសិទ្ធភាពគំរូដែលមិនធ្វើឱ្យខូចភាពត្រឹមត្រូវ
Quantization អាចកាត់បន្ថយអង្គចងចាំ និងបង្កើនល្បឿន ops ប៉ុន្តែការក្រិតតាមខ្នាតជាមួយទិន្នន័យតំណាង ឬគំរូអាចធ្វើអោយសត្វកំប្រុកយល់ច្រឡំនៅកន្លែងដែលមានកោណចរាចរណ៍។ Distillation-គ្រូណែនាំសិស្សតូច-ច្រើនតែរក្សាអត្ថន័យ។ [3]
2) គែមនៃការរត់ការសន្និដ្ឋាននៅក្នុងការអនុវត្ត
អ្នកបកប្រែរបស់ LiteRT មានចេតនាបង្កើតអង្គចងចាំតិចដោយចេតនានៅពេលដំណើរការ។ ONNX Runtime ដោតចូលទៅក្នុងឧបករណ៍បង្កើនល្បឿនផ្សេងៗតាមរយៈអ្នកផ្តល់ការប្រតិបត្តិ។ ទាំងគ្រាប់កាំភ្លើងមិនមែនជាប្រាក់; ទាំងពីរគឺជាញញួររឹង។ [3][4]
3) ភាពរឹងមាំនៅក្នុងព្រៃ
កំដៅ ធូលី ថាមពលមិនប្រក្រតី slapdash Wi-Fi៖ បង្កើតឧបករណ៍ឃ្លាំមើលដែលចាប់ផ្តើមបំពង់ឡើងវិញ ការសម្រេចចិត្តក្នុងឃ្លាំងសម្ងាត់ និងផ្សះផ្សានៅពេលដែលបណ្តាញត្រឡប់មកវិញ។ ភាពទាក់ទាញតិចជាងការយកចិត្តទុកដាក់ - សំខាន់ជាង។
ឃ្លាដែលអ្នកនឹងនិយាយម្តងទៀតនៅក្នុងការប្រជុំ - តើអ្វីទៅជា Edge AI 🗣️
Edge AI ផ្លាស់ទីភាពវៃឆ្លាតឱ្យខិតទៅជិតទិន្នន័យ ដើម្បីបំពេញតាមឧបសគ្គជាក់ស្តែងនៃភាពយឺតយ៉ាវ ភាពឯកជន កម្រិតបញ្ជូន និងភាពជឿជាក់។ វេទមន្តមិនមែនជាបន្ទះឈីបមួយឬក្របខណ្ឌនោះទេ វាកំពុងតែជ្រើសរើសយ៉ាងឆ្លាតវៃនូវអ្វីដែលត្រូវគណនាពីកន្លែងណា។
សុន្ទរកថាចុងក្រោយ - វែងពេក ខ្ញុំមិនបានអានវា🧵
Edge AI ដំណើរការម៉ូដែលនៅជិតទិន្នន័យ ដូច្នេះផលិតផលមានអារម្មណ៍លឿន ឯកជន និងរឹងមាំ។ អ្នកនឹងបញ្ចូលការសន្និដ្ឋានក្នុងតំបន់ជាមួយនឹងការត្រួតពិនិត្យលើពពកសម្រាប់ភាពល្អបំផុតនៃពិភពទាំងពីរ។ ជ្រើសរើសពេលវេលាដំណើរការដែលត្រូវគ្នានឹងឧបករណ៍របស់អ្នក ពឹងផ្អែកលើឧបករណ៍បង្កើនល្បឿននៅពេលដែលអ្នកអាចធ្វើបាន រក្សាម៉ូដែលឱ្យនៅជាប់នឹងការបង្ហាប់ និងការរចនាប្រតិបត្តិការកងនាវាដូចជាការងាររបស់អ្នកអាស្រ័យលើវា ព្រោះវាប្រហែលជា។ ប្រសិនបើនរណាម្នាក់សួរ ថាតើ Edge AI គឺជាអ្វី ចូរនិយាយថា៖ ការសម្រេចចិត្តដ៏ឆ្លាតវៃ ធ្វើឡើងក្នុងមូលដ្ឋានទាន់ពេលវេលា។ បន្ទាប់មកញញឹម ហើយប្តូរប្រធានបទទៅជាថ្ម។ 🔋🙂
ឯកសារយោង
-
IBM - តើ Edge AI ជាអ្វី? (និយមន័យ, អត្ថប្រយោជន៍) ។
https://www.ibm.com/think/topics/edge-ai -
NIST - SP 500-325: Fog Computing Conceptual Model (បរិបទផ្លូវការសម្រាប់អ័ព្ទ/គែម)។
https://csrc.nist.gov/pubs/sp/500/325/final -
Google AI Edge - LiteRT (ពីមុន TensorFlow Lite) (ពេលដំណើរការ បរិមាណ ការធ្វើចំណាកស្រុក)។
https://ai.google.dev/edge/litert -
ONNX Runtime - ការបណ្តុះបណ្តាលលើឧបករណ៍ (ពេលរត់ចល័ត + ការហ្វឹកហាត់នៅលើឧបករណ៍គែម)។
https://onnxruntime.ai/docs/get-started/training-on-device.html -
Apple Machine Learning Research - ការដាក់ពង្រាយ Transformers នៅលើ Apple Neural Engine (ANE efficiency notes)។
https://machinelearning.apple.com/research/neural-engine-transformers