តើ Edge AI ជាអ្វី?

តើ Edge AI ជាអ្វី?

Edge AI ជំរុញការស៊ើបការណ៍សម្ងាត់ទៅកាន់កន្លែងដែលទិន្នន័យកើត។ វាស្តាប់ទៅដូចជាស្រើបស្រាល ប៉ុន្តែគំនិតស្នូលគឺសាមញ្ញ៖ ធ្វើការគិតនៅជាប់នឹងឧបករណ៍ចាប់សញ្ញា ដូច្នេះលទ្ធផលនឹងបង្ហាញឡើងឥឡូវនេះ មិនមែននៅពេលក្រោយទេ។ អ្នកទទួលបានល្បឿន ភាពអាចជឿជាក់បាន និងរឿងរ៉ាវឯកជនភាពសមរម្យដោយមិនចាំបាច់មានអ្នកមើលថែទាំក្មេងគ្រប់ការសម្រេចចិត្ត។ ចូរស្រាយវាចេញ - ផ្លូវកាត់ និងដំណើរស្វែងរកចំហៀងរួមបញ្ចូល។ 😅

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 តើអ្វីទៅជា AI ជំនាន់
ការពន្យល់ច្បាស់លាស់នៃ AI ជំនាន់មុន របៀបដែលវាដំណើរការ និងការប្រើប្រាស់ជាក់ស្តែង។

🔗 តើអ្វីទៅជាភ្នាក់ងារ AI
ទិដ្ឋភាពទូទៅនៃភ្នាក់ងារ AI ឥរិយាបថស្វយ័ត និងគំរូកម្មវិធីក្នុងពិភពពិត។

🔗 តើអ្វីទៅជា AI ធ្វើមាត្រដ្ឋាន
ស្វែងយល់ពីរបៀបធ្វើមាត្រដ្ឋានប្រព័ន្ធ AI ប្រកបដោយភាពជឿជាក់ ប្រសិទ្ធភាព និងការចំណាយប្រកបដោយប្រសិទ្ធភាព។

🔗 អ្វី​ទៅ​ជា​ក្របខ័ណ្ឌ​កម្មវិធី​សម្រាប់ AI
ការបំបែកក្របខ័ណ្ឌកម្មវិធី AI អត្ថប្រយោជន៍ស្ថាបត្យកម្ម និងមូលដ្ឋានគ្រឹះនៃការអនុវត្ត។

តើ Edge AI ជាអ្វី? និយមន័យរហ័ស 🧭

Edge AI គឺជាការអនុវត្តនៃការដំណើរការម៉ូដែលរៀនម៉ាស៊ីនដែលបានបណ្តុះបណ្តាលដោយផ្ទាល់នៅលើ ឬនៅជិតឧបករណ៍ដែលប្រមូលទិន្នន័យ ទូរស័ព្ទ កាមេរ៉ា មនុស្សយន្ត រថយន្ត ឧបករណ៍ពាក់ ឧបករណ៍បញ្ជាឧស្សាហកម្ម ដែលអ្នកដាក់ឈ្មោះវា។ ជំនួសឱ្យការដឹកជញ្ជូនទិន្នន័យឆៅទៅកាន់ម៉ាស៊ីនមេឆ្ងាយសម្រាប់ការវិភាគ ឧបករណ៍ដំណើរការបញ្ចូលក្នុងមូលដ្ឋាន ហើយផ្ញើតែសេចក្តីសង្ខេប ឬគ្មានអ្វីទាំងអស់។ ការ​ធ្វើ​ដំណើរ​ទៅ​មក​តិច​ជាង ភាព​យឺតយ៉ាវ​តិច ការ​គ្រប់​គ្រង​កាន់​តែ​ច្រើន។ ប្រសិនបើអ្នកចង់បានអ្នកពន្យល់អ្នកលក់ស្អាត ចាប់ផ្តើមនៅទីនេះ។ [1]

 

បញ្ញាសិប្បនិម្មិតគែម

តើអ្វីដែលធ្វើឱ្យ Edge AI ពិតជាមានប្រយោជន៍? 🌟

  • ភាពយឺតយ៉ាវទាប - ការសម្រេចចិត្តកើតឡើងនៅលើឧបករណ៍ ដូច្នេះការឆ្លើយតបនឹងមានអារម្មណ៍ភ្លាមៗសម្រាប់កិច្ចការនៃការយល់ឃើញ ដូចជាការរកឃើញវត្ថុ ការដាស់ពាក្យ ឬការជូនដំណឹងអំពីភាពមិនប្រក្រតី។ [1]

  • ភាពឯកជនតាមតំបន់ - ទិន្នន័យរសើបអាចស្ថិតនៅលើឧបករណ៍ កាត់បន្ថយការប៉ះពាល់ និងជួយក្នុងការពិភាក្សាកាត់បន្ថយទិន្នន័យ។ [1]

  • ការសន្សំកម្រិតបញ្ជូន - ផ្ញើលក្ខណៈពិសេស ឬព្រឹត្តិការណ៍ជំនួសឱ្យស្ទ្រីមឆៅ។ [1]

  • ភាពធន់ - ដំណើរការក្នុងអំឡុងពេលភ្ជាប់ស្គ្រីប។

  • ការគ្រប់គ្រងថ្លៃដើម - វដ្តគណនាពពកតិចជាងមុន និងដំណើរការទាប។

  • ការយល់ដឹងអំពីបរិបទ - ឧបករណ៍ "មានអារម្មណ៍ថា" បរិស្ថាននិងសម្របខ្លួន។

សង្ខេបខ្លីៗ៖ អ្នកបើកយន្តហោះលក់រាយបានផ្លាស់ប្តូរការបង្ហោះកាមេរ៉ាថេរសម្រាប់ការចាត់ថ្នាក់មនុស្សទល់នឹងវត្ថុនៅលើឧបករណ៍ ហើយបានជំរុញតែការរាប់ម៉ោង និងឈុតលើកលែងប៉ុណ្ណោះ។ លទ្ធផល៖ ការដាស់តឿនរង 200 ms នៅគែមធ្នើ និង ~ 90% ធ្លាក់ចុះក្នុងចរាចរណ៍ឡើងលើ-ដោយមិនផ្លាស់ប្តូរកិច្ចសន្យា WAN ហាង។ (វិធីសាស្រ្ត៖ ការសន្និដ្ឋានក្នុងស្រុក ការប្រមូលព្រឹត្តិការណ៍ ភាពមិនប្រក្រតីតែប៉ុណ្ណោះ។ )

Edge AI vs cloud AI - កម្រិតពណ៌រហ័ស🥊

  • កន្លែងដែលការគណនាកើតឡើង : edge = on-device/near-device; ពពក = មជ្ឈមណ្ឌលទិន្នន័យពីចម្ងាយ។

  • ភាពយឺតយ៉ាវ ៖ គែម≈ពេលវេលាពិត; ពពកមានការធ្វើដំណើរជុំវិញ។

  • ចលនាទិន្នន័យ ៖ តម្រងគែម/បង្ហាប់ជាមុនសិន; cloud ចូលចិត្តការបង្ហោះដែលមានភាពស្មោះត្រង់ពេញលេញ។

  • ភាពជឿជាក់ ៖ គែមបន្តដំណើរការក្រៅបណ្តាញ។ ពពកត្រូវការការតភ្ជាប់។

  • អភិបាលកិច្ច : edge គាំទ្រការបង្រួមទិន្នន័យ។ ពពកធ្វើការត្រួតពិនិត្យជាកណ្តាល។ [1]

វាមិនមែនទាំងឬក៏អត់។ ប្រព័ន្ធឆ្លាតវៃរួមបញ្ចូលគ្នាទាំងពីរ៖ ការសម្រេចចិត្តរហ័សក្នុងមូលដ្ឋាន ការវិភាគកាន់តែស៊ីជម្រៅ និងការរៀនកងនាវានៅកណ្តាល។ ចម្លើយកូនកាត់គឺគួរឱ្យធុញ និងត្រឹមត្រូវ។

របៀបដែល Edge AI ពិតជាដំណើរការនៅក្រោមក្រណាត់🧩

  1. ឧបករណ៍ចាប់សញ្ញា ចាប់យកសញ្ញាឆៅ-ស៊ុមអូឌីយ៉ូ, ភីកសែលកាមេរ៉ា, ការប៉ះ IMU, ដានរំញ័រ។

  2. ដំណើរការមុននឹង ផ្លាស់ប្តូរសញ្ញាទាំងនោះទៅជាលក្ខណៈពិសេសដែលសាកសមនឹងម៉ូដែល។

  3. ពេលវេលាដំណើរការការសន្និដ្ឋាន ដំណើរការគំរូបង្រួមនៅលើឧបករណ៍ដោយប្រើឧបករណ៍បង្កើនល្បឿននៅពេលមាន។

  4. ដំណើរការក្រោយដំណើរការ ប្រែក្លាយលទ្ធផលទៅជាព្រឹត្តិការណ៍ ស្លាក ឬសកម្មភាពត្រួតពិនិត្យ។

  5. Telemetry បង្ហោះតែអ្វីដែលមានប្រយោជន៍៖ សេចក្តីសង្ខេប ភាពមិនប្រក្រតី ឬមតិកែលម្អតាមកាលកំណត់។

ពេលវេលាដំណើរការនៅលើឧបករណ៍ដែលអ្នកនឹងឃើញនៅក្នុងធម្មជាតិរួមមាន LiteRT (ពីមុន TensorFlow Lite), ONNX Runtime និង OpenVINO ។ ខ្សែសង្វាក់ឧបករណ៍ទាំងនេះច្របាច់បញ្ចូលពីថវិកាថាមពល/អង្គចងចាំដ៏តឹងរឹង ជាមួយនឹងល្បិចដូចជា quantization និង operator fusion។ ប្រសិនបើអ្នកចូលចិត្តគ្រាប់ និងប៊ូឡុង ឯកសាររបស់ពួកគេគឺរឹង។ [3][4]

កន្លែងដែលវាបង្ហាញ - ករណីប្រើប្រាស់ពិត អ្នកអាចចង្អុលទៅ 🧯🚗🏭

  • ការមើលឃើញនៅគែម ៖ កាមេរ៉ាកណ្ដឹងទ្វារ (មនុស្សទល់នឹងសត្វចិញ្ចឹម) ការស្កែនលើធ្នើក្នុងហាងលក់រាយ យន្តហោះគ្មានមនុស្សបើកមើលកំហុស។

  • សំឡេងនៅលើឧបករណ៍ ៖ ដាស់ពាក្យ ការសរសេរតាមអាន ការរកឃើញលេចធ្លាយនៅក្នុងរុក្ខជាតិ។

  • IoT ឧស្សាហកម្ម ៖ ម៉ូទ័រ និងស្នប់ត្រូវបានត្រួតពិនិត្យសម្រាប់ភាពមិនធម្មតានៃរំញ័រមុនពេលបរាជ័យ។

  • យានជំនិះ ៖ ការត្រួតពិនិត្យអ្នកបើកបរ ការរកឃើញគន្លងផ្លូវ ជំនួយការចតរថយន្ត - វិនាទី ឬបុក។

  • ការថែទាំសុខភាព : ការពាក់ទង់ជាតិ arrhythmias ក្នុងស្រុក; ធ្វើសមកាលកម្មសង្ខេបនៅពេលក្រោយ។

  • ស្មាតហ្វូន ៖ ការកែលម្អរូបថត ការរកឃើញសារឥតបានការ ការហៅទូរសព្ទ “តើទូរសព្ទរបស់ខ្ញុំធ្វើដោយរបៀបណាពេលគ្មានអ៊ីនធឺណិត”។

សម្រាប់និយមន័យផ្លូវការ (និង "អ័ព្ទទល់នឹងគែម" ការពិភាក្សាបងប្អូនជីដូនមួយ) សូមមើលគំរូគំនិត NIST ។ [2]

Hardware ដែលធ្វើអោយវាមានភាពរហ័សរហួន🔌

វេទិកាមួយចំនួនត្រូវបានពិនិត្យឈ្មោះជាច្រើន៖

  • NVIDIA Jetson - ម៉ូឌុលដែលដំណើរការដោយ GPU សម្រាប់មនុស្សយន្ត/កាមេរ៉ា-Swiss-Army-knife vibes សម្រាប់ AI ដែលបានបង្កប់។

  • Google Edge TPU + LiteRT - ការសន្និដ្ឋានចំនួនគត់ប្រកបដោយប្រសិទ្ធភាព និងពេលវេលាដំណើរការដ៏ងាយស្រួលសម្រាប់គម្រោងថាមពលទាបបំផុត។ [3]

  • Apple Neural Engine (ANE) - ML នៅលើឧបករណ៍ដ៏តឹងរឹងសម្រាប់ iPhone, iPad និង Mac; ក្រុមហ៊ុន Apple បានបោះពុម្ពផ្សាយការងារជាក់ស្តែងលើការដាក់ពង្រាយ transformers ប្រកបដោយប្រសិទ្ធភាពនៅលើ ANE ។ [5]

  • ស៊ីភីយូ Intel / iGPUs / NPUs ជាមួយ OpenVINO - "សរសេរម្តង ដាក់ពង្រាយគ្រប់ទីកន្លែង" នៅលើផ្នែករឹងរបស់ Intel; ការបង្កើនប្រសិទ្ធភាពដែលមានប្រយោជន៍ឆ្លងកាត់។

  • ONNX Runtime គ្រប់ទីកន្លែង - រយៈពេលដំណើរការអព្យាក្រឹតជាមួយអ្នកផ្តល់ការប្រតិបត្តិដែលអាចដោតបានតាមរយៈទូរស័ព្ទ កុំព្យូទ័រ និងច្រកផ្លូវ។ [4]

តើអ្នកត្រូវការវាទាំងអស់ទេ? មិនពិតទេ។ ជ្រើសរើសផ្លូវដ៏រឹងមាំមួយដែលសមនឹងកងនាវារបស់អ្នក ហើយនៅជាប់នឹងវា - កូរគឺជាសត្រូវនៃក្រុមដែលបានបង្កប់។

ជង់កម្មវិធី - ដំណើរកម្សាន្តខ្លី🧰

  • ការបង្ហាប់គំរូ ៖ បរិមាណ (ជាញឹកញាប់ដល់ int8), ការកាត់ចេញ, ការចម្រាញ់។

  • ការបង្កើនល្បឿននៃកម្រិតប្រតិបត្តិករ ៖ ខឺណែលបានលៃតម្រូវទៅនឹងស៊ីលីកុនរបស់អ្នក។

  • ពេលវេលាដំណើរការ ៖ LiteRT, ONNX Runtime, OpenVINO ។ [3][4]

  • កញ្ចប់ដាក់ពង្រាយ ៖ ធុង/កញ្ចប់កម្មវិធី; ពេលខ្លះសេវាមីក្រូនៅលើច្រកផ្លូវ។

  • MLOps សម្រាប់គែម ៖ ការអាប់ដេតគំរូ OTA, ការដាក់ចេញ A/B, រង្វិលជុំ telemetry ។

  • ការគ្រប់គ្រងភាពឯកជន និងសុវត្ថិភាព ៖ ការអ៊ិនគ្រីបនៅលើឧបករណ៍ ការចាប់ផ្ដើមសុវត្ថិភាព ការបញ្ជាក់ ការភ្ជាប់។

Mini-case៖ ក្រុមត្រួតពិនិត្យយន្តហោះគ្មានមនុស្សបើកមួយបានចម្រាញ់ឧបករណ៍រាវរកទម្ងន់ធ្ងន់ចូលទៅក្នុងគំរូសិស្សបរិមាណសម្រាប់ LiteRT បន្ទាប់មកបញ្ចូល NMS នៅលើឧបករណ៍។ ពេលវេលាហោះហើរបានប្រសើរឡើង ~ 15% ដោយសារការចាប់ឆ្នោតទាប។ កម្រិតសំឡេងផ្ទុកឡើងបានធ្លាក់ចុះដល់ស៊ុមករណីលើកលែង។ (វិធីសាស្រ្ត៖ ការចាប់យកសំណុំទិន្នន័យនៅលើគេហទំព័រ ការក្រិតតាមខ្នាតក្រោយបរិមាណ របៀបស្រមោល A/B មុនពេលការចេញផ្សាយពេញលេញ។ )

តារាងប្រៀបធៀប - ជម្រើស Edge AI ដ៏ពេញនិយម🧪

ការនិយាយពិត៖ តារាងនេះគឺមានការយល់ឃើញ និងមានភាពរញ៉េរញ៉ៃបន្តិច - ដូចជាពិភពលោកពិត។

ឧបករណ៍ / វេទិកា ទស្សនិកជនល្អបំផុត តម្លៃ​ប្រកួតប្រជែង ហេតុអ្វីបានជាវាដំណើរការនៅលើគែម
LiteRT (អតីត TFLite) ប្រព័ន្ធប្រតិបត្តិការ Android, អ្នកបង្កើត, បង្កប់ $ ទៅ $$ ពេលវេលាដំណើរការគ្មានខ្លាញ់, ឯកសាររឹងមាំ, ឧបករណ៍ចល័តដំបូង។ ដំណើរការក្រៅបណ្តាញយ៉ាងស្អាត។ [3]
រយៈពេលដំណើរការ ONNX ក្រុមឆ្លងវេទិកា $ ទម្រង់អព្យាក្រឹត, ផ្នែកខាងក្រោយផ្នែករឹងដែលអាចដោតបាន - ងាយស្រួលសម្រាប់អនាគត។ [4]
OpenVINO ការដាក់ពង្រាយ Intel-centric $ កញ្ចប់ឧបករណ៍មួយ គោលដៅ Intel ជាច្រើន; ការបង្កើនប្រសិទ្ធភាពងាយស្រួលឆ្លងកាត់។
NVIDIA Jetson មនុស្សយន្ត, ចក្ខុវិស័យ - ធ្ងន់ $$ ទៅ $$$ ការបង្កើនល្បឿន GPU នៅក្នុងប្រអប់អាហារថ្ងៃត្រង់; ប្រព័ន្ធអេកូធំទូលាយ។
ផ្លែប៉ោម ANE កម្មវិធី iOS / iPadOS / macOS តម្លៃឧបករណ៍ សមាហរណកម្ម HW/SW តឹង; ការងារប្លែង ANE ដែលមានឯកសារយ៉ាងល្អ។ [5]
គែម TPU + LiteRT គម្រោងថាមពលទាបបំផុត។ $ ការសន្និដ្ឋានប្រកបដោយប្រសិទ្ធភាព int8 នៅគែម; តូចតែមានសមត្ថភាព។ [3]

របៀបជ្រើសរើសផ្លូវ Edge AI - ដើមឈើការសម្រេចចិត្តដ៏តូចមួយ🌳

  • ជីវិតរបស់អ្នកពិបាកក្នុងពេលវេលាពិត? ចាប់ផ្តើមជាមួយឧបករណ៍បង្កើនល្បឿន + គំរូបរិមាណ។

  • ប្រភេទឧបករណ៍ជាច្រើន? ពេញចិត្ត ONNX Runtime ឬ OpenVINO សម្រាប់ចល័ត។ [4]

  • ដឹកជញ្ជូនកម្មវិធីទូរស័ព្ទ? LiteRT គឺជាផ្លូវនៃការតស៊ូតិចបំផុត។ [3]

  • មនុស្សយន្ត ឬការវិភាគកាមេរ៉ា? មុខងារដែលងាយស្រួលប្រើ GPU របស់ Jetson ចំណេញពេលវេលា។

  • ឥរិយាបថឯកជនភាពតឹងរឹង? រក្សាទិន្នន័យក្នុងមូលដ្ឋាន អ៊ិនគ្រីបនៅពេលសម្រាក កំណត់ហេតុសរុបមិនមែនជាស៊ុមឆៅទេ។

  • ក្រុមតូច? ជៀសវាងច្រវ៉ាក់ឧបករណ៍កម្រនិងអសកម្ម - គួរឱ្យធុញគឺស្រស់ស្អាត។

  • ម៉ូដែលនឹងផ្លាស់ប្តូរជាញឹកញាប់? រៀបចំផែនការ OTA និង telemetry ចាប់ពីថ្ងៃដំបូង។

ហានិភ័យ ដែនកំណត់ និងប៊ីតដែលគួរឱ្យធុញ ប៉ុន្តែសំខាន់🧯

  • គំរូរសាត់ - ការផ្លាស់ប្តូរបរិស្ថាន; តាមដានការចែកចាយ, ដំណើរការរបៀបស្រមោល, ហ្វឹកហាត់ឡើងវិញជាទៀងទាត់។

  • ការគណនាពិដាន - អង្គចងចាំតឹង / កម្លាំងថាមពលម៉ូដែលតូចជាងឬភាពត្រឹមត្រូវដែលបន្ធូរបន្ថយ។

  • សុវត្ថិភាព - សន្មត់ការចូលប្រើរាងកាយ; ប្រើការចាប់ផ្ដើមសុវត្ថិភាព វត្ថុបុរាណដែលបានចុះហត្ថលេខា ការបញ្ជាក់ សេវាកម្មដែលមានសិទ្ធិតិចបំផុត។

  • ការគ្រប់គ្រងទិន្នន័យ - ដំណើរការក្នុងមូលដ្ឋានជួយ ប៉ុន្តែអ្នកនៅតែត្រូវការការយល់ព្រម រក្សា និងពង្រីកវិសាលភាពទូរលេខ។

  • Fleet ops - ឧបករណ៍ដំណើរការក្រៅបណ្តាញនៅពេលដ៏អាក្រក់បំផុត; រចនាពន្យាការអាប់ដេត និងការបង្ហោះឡើងវិញ។

  • ការលាយទេពកោសល្យ - បង្កប់ + ML + DevOps គឺជានាវិក motley; រថភ្លើងឆ្លងកាត់មុន។

ផែនទីបង្ហាញផ្លូវជាក់ស្តែងដើម្បីដឹកជញ្ជូនរបស់ដែលមានប្រយោជន៍🗺️

  1. ជ្រើសរើសករណីប្រើប្រាស់មួយ ជាមួយនឹងការរកឃើញកំហុសតម្លៃដែលអាចវាស់វែងបាននៅលើបន្ទាត់ទី 3 ការដាស់ពាក្យនៅលើឧបករណ៍បំពងសំឡេងឆ្លាតវៃ។ល។

  2. ប្រមូលសំណុំទិន្នន័យយ៉ាងម៉ត់ចត់ ដែលឆ្លុះបញ្ចាំងពីបរិយាកាសគោលដៅ។ ចាក់សំលេងរំខានដើម្បីផ្គូផ្គងការពិត។

  3. គំរូដើមនៅលើឧបករណ៍អភិវឌ្ឍន៍ ដែលនៅជិតផ្នែករឹងផលិតកម្ម។

  4. បង្រួមគំរូ ជាមួយនឹងបរិមាណ / កាត់ចេញ; វាស់វែងការបាត់បង់ភាពត្រឹមត្រូវដោយស្មោះត្រង់។ [3]

  5. រុំការសន្និដ្ឋាននៅក្នុង API ស្អាត ជាមួយ backpressure និង watchdogs ពីព្រោះឧបករណ៍ព្យួរនៅម៉ោង 2 ព្រឹក

  6. រចនាទូរលេខ ដែលគោរពភាពឯកជន៖ ផ្ញើចំនួន អ៊ីស្តូក្រាម លក្ខណៈពិសេសដែលស្រង់ចេញពីគែម។

  7. ពង្រឹងសុវត្ថិភាព ៖ ប្រព័ន្ធគោលពីរដែលបានចុះហត្ថលេខា ការចាប់ផ្ដើមសុវត្ថិភាព សេវាកម្មតិចតួចបំផុតបើក។

  8. ផែនការ OTA ៖ ការចេញដំណើរដ៏គួរឱ្យភ្ញាក់ផ្អើល, Canaries, ការវិលត្រឡប់មកវិញភ្លាមៗ។

  9. អ្នកបើកយន្តហោះនៅក្នុងករណីដ៏អាក្រក់មួយ ជាមុនសិន ប្រសិនបើវារស់នៅទីនោះ វានឹងរស់បានគ្រប់ទីកន្លែង។

  10. ធ្វើមាត្រដ្ឋានជាមួយសៀវភៅលេង ៖ របៀបដែលអ្នកនឹងបន្ថែមម៉ូដែល បង្វិលសោ រក្សាទុកទិន្នន័យ ដូច្នេះគម្រោង #2 មិនមែនជារឿងច្របូកច្របល់ទេ។

សំណួរគេសួរញឹកញាប់ - ចម្លើយខ្លីចំពោះ អ្វីដែល Edge AI ចង់ដឹងចង់ឃើញ ❓

តើ Edge AI គ្រាន់តែដំណើរការគំរូតូចមួយនៅលើកុំព្យូទ័រដ៏តូចមែនទេ?
ភាគច្រើន បាទ-ប៉ុន្តែទំហំមិនមែនជារឿងទាំងមូលទេ។ វាក៏និយាយអំពីថវិកាពេលយឺតយ៉ាវ ការសន្យាឯកជនភាព និងការចាត់ចែងឧបករណ៍ជាច្រើនដែលដំណើរការនៅក្នុងមូលដ្ឋាន ប៉ុន្តែកំពុងសិក្សានៅទូទាំងពិភពលោក។ [1]

តើខ្ញុំអាចហ្វឹកហាត់នៅលើគែមបានទេ?
មាន​ការ​ហ្វឹកហ្វឺន​លើ​ឧបករណ៍​ទម្ងន់​ស្រាល/ការ​កំណត់​ផ្ទាល់ខ្លួន។ ការហ្វឹកហ្វឺនដែលធ្ងន់ជាងនេះនៅតែដំណើរការនៅកណ្តាល។ ONNX Runtime ឯកសារជម្រើសបណ្តុះបណ្តាលនៅលើឧបករណ៍ ប្រសិនបើអ្នកជាអ្នកផ្សងព្រេង។ [4]

តើ Edge AI vs Fog Computing ជាអ្វី?
អ័ព្ទនិងគែមគឺជាបងប្អូនជីដូនមួយ ទាំងពីរនាំការគណនាកាន់តែខិតទៅជិតប្រភពទិន្នន័យ ជួនកាលតាមរយៈច្រកផ្លូវក្បែរនោះ។ សម្រាប់និយមន័យ និងបរិបទផ្លូវការ សូមមើល NIST ។ [2]

តើ Edge AI តែងតែកែលម្អភាពឯកជនដែរឬទេ?
វាជួយ - ប៉ុន្តែវាមិនមែនជាវេទមន្តទេ។ អ្នកនៅតែត្រូវការការបង្រួមអប្បបរមា ផ្លូវធ្វើបច្ចុប្បន្នភាពសុវត្ថិភាព និងការកត់ត្រាដោយប្រុងប្រយ័ត្ន។ ចាត់ទុកភាពឯកជនជាទម្លាប់ មិនមែនជាប្រអប់ធីកទេ។

ការជ្រមុជទឹកជ្រៅដែលអ្នកពិតជាអាចអាន📚

1) ការបង្កើនប្រសិទ្ធភាពគំរូដែលមិនធ្វើឱ្យខូចភាពត្រឹមត្រូវ

Quantization អាចកាត់បន្ថយអង្គចងចាំ និងបង្កើនល្បឿន ops ប៉ុន្តែការក្រិតតាមខ្នាតជាមួយទិន្នន័យតំណាង ឬគំរូអាចធ្វើអោយសត្វកំប្រុកយល់ច្រឡំនៅកន្លែងដែលមានកោណចរាចរណ៍។ Distillation-គ្រូណែនាំសិស្សតូច-ច្រើនតែរក្សាអត្ថន័យ។ [3]

2) គែមនៃការរត់ការសន្និដ្ឋាននៅក្នុងការអនុវត្ត

អ្នកបកប្រែរបស់ LiteRT មានចេតនាបង្កើតអង្គចងចាំតិចដោយចេតនានៅពេលដំណើរការ។ ONNX Runtime ដោតចូលទៅក្នុងឧបករណ៍បង្កើនល្បឿនផ្សេងៗតាមរយៈអ្នកផ្តល់ការប្រតិបត្តិ។ ទាំង​គ្រាប់​កាំភ្លើង​មិន​មែន​ជា​ប្រាក់; ទាំងពីរគឺជាញញួររឹង។ [3][4]

3) ភាពរឹងមាំនៅក្នុងព្រៃ

កំដៅ ធូលី ថាមពលមិនប្រក្រតី slapdash Wi-Fi៖ បង្កើតឧបករណ៍ឃ្លាំមើលដែលចាប់ផ្តើមបំពង់ឡើងវិញ ការសម្រេចចិត្តក្នុងឃ្លាំងសម្ងាត់ និងផ្សះផ្សានៅពេលដែលបណ្តាញត្រឡប់មកវិញ។ ភាពទាក់ទាញតិចជាងការយកចិត្តទុកដាក់ - សំខាន់ជាង។

ឃ្លាដែលអ្នកនឹងនិយាយម្តងទៀតនៅក្នុងការប្រជុំ - តើអ្វីទៅជា Edge AI 🗣️

Edge AI ផ្លាស់ទីភាពវៃឆ្លាតឱ្យខិតទៅជិតទិន្នន័យ ដើម្បីបំពេញតាមឧបសគ្គជាក់ស្តែងនៃភាពយឺតយ៉ាវ ភាពឯកជន កម្រិតបញ្ជូន និងភាពជឿជាក់។ វេទមន្ត​មិន​មែន​ជា​បន្ទះ​ឈីប​មួយ​ឬ​ក្របខណ្ឌ​នោះ​ទេ​ វា​កំពុង​តែ​ជ្រើសរើស​យ៉ាង​ឆ្លាតវៃ​នូវ​អ្វី​ដែល​ត្រូវ​គណនា​ពី​កន្លែង​ណា។

សុន្ទរកថាចុងក្រោយ - វែងពេក ខ្ញុំមិនបានអានវា🧵

Edge AI ដំណើរការម៉ូដែលនៅជិតទិន្នន័យ ដូច្នេះផលិតផលមានអារម្មណ៍លឿន ឯកជន និងរឹងមាំ។ អ្នក​នឹង​បញ្ចូល​ការ​សន្និដ្ឋាន​ក្នុង​តំបន់​ជាមួយ​នឹង​ការ​ត្រួត​ពិនិត្យ​លើ​ពពក​សម្រាប់​ភាព​ល្អ​បំផុត​នៃ​ពិភព​ទាំង​ពីរ។ ជ្រើសរើសពេលវេលាដំណើរការដែលត្រូវគ្នានឹងឧបករណ៍របស់អ្នក ពឹងផ្អែកលើឧបករណ៍បង្កើនល្បឿននៅពេលដែលអ្នកអាចធ្វើបាន រក្សាម៉ូដែលឱ្យនៅជាប់នឹងការបង្ហាប់ និងការរចនាប្រតិបត្តិការកងនាវាដូចជាការងាររបស់អ្នកអាស្រ័យលើវា ព្រោះវាប្រហែលជា។ ប្រសិនបើនរណាម្នាក់សួរ ថាតើ Edge AI គឺជាអ្វី ចូរនិយាយថា៖ ការសម្រេចចិត្តដ៏ឆ្លាតវៃ ធ្វើឡើងក្នុងមូលដ្ឋានទាន់ពេលវេលា។ បន្ទាប់មកញញឹម ហើយប្តូរប្រធានបទទៅជាថ្ម។ 🔋🙂


ឯកសារយោង

  1. IBM - តើ Edge AI ជាអ្វី? (និយមន័យ, អត្ថប្រយោជន៍) ។
    https://www.ibm.com/think/topics/edge-ai

  2. NIST - SP 500-325: Fog Computing Conceptual Model (បរិបទផ្លូវការសម្រាប់អ័ព្ទ/គែម)។
    https://csrc.nist.gov/pubs/sp/500/325/final

  3. Google AI Edge - LiteRT (ពីមុន TensorFlow Lite) (ពេលដំណើរការ បរិមាណ ការធ្វើចំណាកស្រុក)។
    https://ai.google.dev/edge/litert

  4. ONNX Runtime - ការបណ្តុះបណ្តាលលើឧបករណ៍ (ពេលរត់ចល័ត + ការហ្វឹកហាត់នៅលើឧបករណ៍គែម)។
    https://onnxruntime.ai/docs/get-started/training-on-device.html

  5. Apple Machine Learning Research - ការដាក់ពង្រាយ Transformers នៅលើ Apple Neural Engine (ANE efficiency notes)។
    https://machinelearning.apple.com/research/neural-engine-transformers

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ