ចម្លើយខ្លី៖ មនុស្សយន្តប្រើប្រាស់បញ្ញាសិប្បនិម្មិត (AI) ដើម្បីដំណើរការរង្វិលជុំជាបន្តបន្ទាប់នៃការចាប់សញ្ញា ការយល់ដឹង ការធ្វើផែនការ ការធ្វើសកម្មភាព និងការរៀនសូត្រ ដូច្នេះពួកវាអាចធ្វើចលនា និងធ្វើការដោយសុវត្ថិភាពនៅក្នុងបរិស្ថានដែលមានភាពរញ៉េរញ៉ៃ និងផ្លាស់ប្តូរ។ នៅពេលដែលឧបករណ៍ចាប់សញ្ញាមានសំឡេងរំខាន ឬទំនុកចិត្តធ្លាក់ចុះ ប្រព័ន្ធដែលរចនាបានល្អនឹងថយចុះល្បឿន ឈប់ដោយសុវត្ថិភាព ឬសុំជំនួយជាជាងការទាយ។
ចំណុចសំខាន់ៗ៖
រង្វិលជុំស្វ័យភាព ៖ កសាងប្រព័ន្ធជុំវិញអារម្មណ៍-យល់-ធ្វើផែនការ-ធ្វើសកម្មភាព-រៀន មិនមែនជាគំរូតែមួយនោះទេ។
ភាពរឹងមាំ ៖ រចនាឡើងសម្រាប់ពន្លឺចាំង ភាពរញ៉េរញ៉ៃ ការរអិល និងចលនារបស់មនុស្សដែលមិនអាចទាយទុកជាមុនបាន។
ភាពមិនប្រាកដប្រជា ៖ បង្ហាញទំនុកចិត្ត ហើយប្រើប្រាស់វាដើម្បីបង្កឱ្យមានឥរិយាបថដែលមានសុវត្ថិភាព និងអភិរក្សនិយមជាងមុន។
កំណត់ហេតុសុវត្ថិភាព ៖ កត់ត្រាសកម្មភាព និងបរិបទ ដើម្បីឱ្យការបរាជ័យអាចធ្វើសវនកម្ម និងអាចជួសជុលបាន។
ជង់ចម្រុះ ៖ ផ្សំ ML ជាមួយនឹងការរឹតបន្តឹងរូបវិទ្យា និងការគ្រប់គ្រងបែបបុរាណសម្រាប់ភាពជឿជាក់។
ខាងក្រោមនេះគឺជាទិដ្ឋភាពទូទៅអំពីរបៀបដែល AI បង្ហាញនៅក្នុងមនុស្សយន្ត ដើម្បីធ្វើឱ្យពួកវាដំណើរការប្រកបដោយប្រសិទ្ធភាព។.
អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖
🔗 នៅពេលដែលមនុស្សយន្តរបស់ Elon Musk គំរាមកំហែងដល់ការងារ
អ្វីដែលមនុស្សយន្តរបស់ក្រុមហ៊ុន Tesla អាចធ្វើបាន និងតួនាទីអ្វីខ្លះដែលអាចផ្លាស់ប្តូរ។.
🔗 តើមនុស្សយន្ត AI ជាអ្វី?
ស្វែងយល់ពីរបៀបដែលមនុស្សយន្តស្រដៀងនឹងមនុស្ស យល់ឃើញ ផ្លាស់ទី និងធ្វើតាមការណែនាំ។.
🔗 តើការងារអ្វីខ្លះដែល AI នឹងជំនួស
តួនាទីដែលងាយរងគ្រោះបំផុតចំពោះស្វ័យប្រវត្តិកម្ម និងជំនាញដែលនៅតែមានតម្លៃ។.
🔗 ការងារបញ្ញាសិប្បនិម្មិត និងអាជីពនាពេលអនាគត
ផ្លូវអាជីព AI សព្វថ្ងៃនេះ និងរបៀបដែល AI ផ្លាស់ប្តូរនិន្នាការការងារ។.
តើមនុស្សយន្តប្រើប្រាស់ AI យ៉ាងដូចម្តេច? គំរូផ្លូវចិត្តរហ័ស
មនុស្សយន្តភាគច្រើនដែលប្រើ AI ធ្វើតាមរង្វិលជុំដូចនេះ៖
-
អារម្មណ៍ 👀៖ កាមេរ៉ា មីក្រូហ្វូន LiDAR ឧបករណ៍ចាប់សញ្ញាកម្លាំង ឧបករណ៍អ៊ិនកូដកង់ ជាដើម។
-
យល់ដឹង 🧠៖ រកឃើញវត្ថុ ប៉ាន់ស្មានទីតាំង ស្គាល់ស្ថានភាព និងទស្សន៍ទាយចលនា។
-
ផែនការ 🗺️៖ ជ្រើសរើសគោលដៅ គណនាផ្លូវដែលមានសុវត្ថិភាព និងកំណត់ពេលភារកិច្ច។
-
សកម្មភាព 🦾៖ បង្កើតពាក្យបញ្ជាម៉ូទ័រ ការក្តាប់ ការរមៀល តុល្យភាព និងជៀសវាងឧបសគ្គ។
-
រៀន 🔁៖ កែលម្អការយល់ឃើញ ឬឥរិយាបថពីទិន្នន័យ (ជួនកាលតាមអ៊ីនធឺណិត ជារឿយៗក្រៅបណ្តាញ)។
«បញ្ញាសិប្បនិម្មិត» ជាច្រើនរបស់មនុស្សយន្ត គឺជាជង់នៃបំណែកៗដែលធ្វើការរួមគ្នា - ការយល់ឃើញ ការ ប៉ាន់ស្មានស្ថានភាព ការធ្វើផែនការ និង ការគ្រប់គ្រង - ដែលរួមគ្នាបង្កើតបានជាស្វ័យភាព។
ការពិតជាក់ស្តែងមួយនៅក្នុង "វាល"៖ ផ្នែកដែលពិបាកជាធម្មតាមិនមែនជាការធ្វើឱ្យមនុស្សយន្តធ្វើអ្វីមួយម្តងនៅក្នុងការបង្ហាញជាក់ស្តែងនោះទេ - វាគឺជាការធ្វើឱ្យវាធ្វើរឿងសាមញ្ញដូចគ្នា ដោយអាចទុកចិត្តបាន នៅពេលដែលភ្លើងផ្លាស់ប្តូរ កង់រអិល កម្រាលឥដ្ឋភ្លឺចែងចាំង ធ្នើរបានផ្លាស់ប្តូរ ហើយមនុស្សដើរដូចជា NPCs ដែលមិនអាចទាយទុកជាមុនបាន។

អ្វីដែលធ្វើឱ្យខួរក្បាល AI ល្អសម្រាប់មនុស្សយន្ត
ការរៀបចំ AI មនុស្សយន្តដ៏រឹងមាំមួយមិនគួរគ្រាន់តែឆ្លាតវៃនោះទេ - វាគួរតែមាន ភាពជឿជាក់ នៅក្នុងបរិយាកាសដែលមិនអាចទាយទុកជាមុនបាន និងក្នុងពិភពពិត។
លក្ខណៈសំខាន់ៗរួមមាន៖
-
ការអនុវត្តជាក់ស្តែង ⏱️ (ពេលវេលាមានសារៈសំខាន់សម្រាប់ការសម្រេចចិត្ត)
-
ភាពរឹងមាំចំពោះទិន្នន័យរញ៉េរញ៉ៃ (ពន្លឺចាំង សំឡេងរំខាន ភាពរញ៉េរញ៉ៃ ភាពព្រិលៗដោយចលនា)
-
របៀបបរាជ័យដ៏ទន់ភ្លន់ 🧯 (បន្ថយល្បឿន ឈប់ដោយសុវត្ថិភាព សុំជំនួយ)
-
អាទិភាពល្អ + ការរៀនសូត្រល្អ (រូបវិទ្យា + ការរឹតបន្តឹង + ML- មិនមែនគ្រាន់តែជា "អារម្មណ៍")
-
គុណភាពនៃការយល់ឃើញដែលអាចវាស់វែងបាន 📏 (ដឹងពីពេលដែលឧបករណ៍ចាប់សញ្ញា/ម៉ូដែលត្រូវបានចុះខ្សោយ)
មនុស្សយន្តល្អបំផុតច្រើនតែមិនមែនជាមនុស្សយន្តដែលអាចធ្វើល្បិចកលបានម្តងនោះទេ ប៉ុន្តែជាមនុស្សយន្តដែលអាចធ្វើការងារគួរឱ្យធុញបានយ៉ាងល្អជារៀងរាល់ថ្ងៃ។.
តារាងប្រៀបធៀបនៃប្លុកសំណង់ AI រ៉ូបូតទូទៅ
| បំណែក/ឧបករណ៍ AI | តើវាសម្រាប់អ្នកណា | តម្លៃ | ហេតុអ្វីបានជាវាដំណើរការ |
|---|---|---|---|
| ចក្ខុវិស័យកុំព្យូទ័រ (ការរកឃើញវត្ថុ ការបែងចែក) 👁️ | មនុស្សយន្តចល័ត អាវុធ និងយន្តហោះគ្មានមនុស្សបើក | មធ្យម | បម្លែងការបញ្ចូលដែលមើលឃើញទៅជាទិន្នន័យដែលអាចប្រើបានដូចជាការកំណត់អត្តសញ្ញាណវត្ថុ |
| SLAM (ការធ្វើផែនទី + ការធ្វើមូលដ្ឋានីយកម្ម) 🗺️ | មនុស្សយន្តដែលធ្វើចលនាជុំវិញ | មធ្យម-ខ្ពស់ | បង្កើតផែនទីមួយខណៈពេលកំពុងតាមដានទីតាំងរបស់មនុស្សយន្ត ដែលមានសារៈសំខាន់សម្រាប់ការរុករក [1] |
| ការរៀបចំផែនការផ្លូវ + ការជៀសវាងឧបសគ្គ 🚧 | បូតដឹកជញ្ជូន, AMRs ឃ្លាំង | មធ្យម | គណនាផ្លូវដែលមានសុវត្ថិភាព និងសម្របខ្លួនទៅនឹងឧបសគ្គក្នុងពេលវេលាជាក់ស្តែង |
| ការគ្រប់គ្រងបែបបុរាណ (PID ការគ្រប់គ្រងផ្អែកលើគំរូ) 🎛️ | អ្វីក៏ដោយដែលមានម៉ូទ័រ | ទាប | ធានានូវចលនាដែលមានស្ថេរភាព និងអាចព្យាករណ៍បាន |
| ការរៀនសូត្រពង្រឹងសមត្ថភាព (RL) 🎮 | ជំនាញស្មុគស្មាញ ការរៀបចំ ចលនា | ខ្ពស់ | រៀនតាមរយៈគោលនយោបាយសាកល្បង និងកំហុសដែលជំរុញដោយរង្វាន់ [3] |
| ការនិយាយ + ភាសា (ASR, ចេតនា, LLMs) 🗣️ | ជំនួយការ, មនុស្សយន្តសេវាកម្ម | មធ្យម-ខ្ពស់ | អនុញ្ញាតឱ្យមានអន្តរកម្មជាមួយមនុស្សតាមរយៈភាសាធម្មជាតិ |
| ការរកឃើញភាពមិនប្រក្រតី + ការត្រួតពិនិត្យ 🚨 | រោងចក្រ ការថែទាំសុខភាព សុវត្ថិភាពសំខាន់ | មធ្យម | រកឃើញលំនាំមិនធម្មតាមុនពេលវាក្លាយជាថ្លៃ ឬគ្រោះថ្នាក់ |
| ការបញ្ចូលគ្នានៃឧបករណ៍ចាប់សញ្ញា (តម្រង Kalman, ការបញ្ចូលគ្នាដែលបានរៀន) 🧩 | ការរុករក, យន្តហោះគ្មានមនុស្សបើក, ជង់ស្វ័យភាព | មធ្យម | បញ្ចូលប្រភពទិន្នន័យដែលមានសំឡេងរំខានសម្រាប់ការប៉ាន់ស្មានកាន់តែត្រឹមត្រូវ [1] |
ការយល់ឃើញ៖ របៀបដែលមនុស្សយន្តប្រែក្លាយទិន្នន័យឧបករណ៍ចាប់សញ្ញាឆៅទៅជាអត្ថន័យ
ការយល់ឃើញ គឺជាកន្លែងដែលមនុស្សយន្តប្រែក្លាយស្ទ្រីមឧបករណ៍ចាប់សញ្ញាទៅជាអ្វីមួយដែលពួកវាអាចប្រើប្រាស់បាន៖
-
កាមេរ៉ា → ការសម្គាល់វត្ថុ ការប៉ាន់ស្មានឥរិយាបថ ការយល់ដឹងពីទិដ្ឋភាព
-
LiDAR → ចម្ងាយ + ធរណីមាត្រឧបសគ្គ
-
កាមេរ៉ាជម្រៅ → រចនាសម្ព័ន្ធ 3D និងទំហំទំនេរ
-
មីក្រូហ្វូន → សញ្ញាសំឡេង និងសំឡេង
-
ឧបករណ៍ចាប់សញ្ញាកម្លាំង/កម្លាំងបង្វិលជុំ → ការក្តាប់ និងការសហការដែលមានសុវត្ថិភាពជាងមុន
-
ឧបករណ៍ចាប់សញ្ញាប៉ះ → ការរកឃើញការរអិល ព្រឹត្តិការណ៍ប៉ះ
មនុស្សយន្តពឹងផ្អែកលើ AI ដើម្បីឆ្លើយសំណួរដូចជា៖
-
«តើមានវត្ថុអ្វីខ្លះនៅពីមុខខ្ញុំ?»
-
«នោះជាមនុស្សឬក៏តុក្កតា?»
-
«តើចំណុចដៃនៅឯណា?»
-
«មានអ្វីមួយកំពុងរំកិលមករកខ្ញុំមែនទេ?»
ព័ត៌មានលម្អិតដ៏ស្រទន់ ប៉ុន្តែសំខាន់មួយ៖ ប្រព័ន្ធយល់ឃើញគួរតែបង្ហាញ ភាពមិនប្រាកដប្រជា (ឬតំណាងទំនុកចិត្ត) មិនមែនគ្រាន់តែជាចម្លើយបាទ/ទេនោះទេ ពីព្រោះការធ្វើផែនការ និងការសម្រេចចិត្តសុវត្ថិភាពនៅផ្នែកខាងក្រោមអាស្រ័យលើ ភាពប្រាកដប្រជា របស់រ៉ូបូត។
ការធ្វើមូលដ្ឋានីយកម្ម និងការគូសផែនទី៖ ដឹងពីកន្លែងដែលអ្នកនៅដោយមិនភ័យស្លន់ស្លោ
មនុស្សយន្តត្រូវដឹងពីកន្លែងដែលវាដំណើរការបានត្រឹមត្រូវ។ ជារឿយៗវាត្រូវបានដោះស្រាយតាមរយៈ SLAM (Simultaneous Localization and Mapping) ៖ ការបង្កើតផែនទី ខណៈពេលកំពុងប៉ាន់ស្មានទីតាំងរបស់មនុស្សយន្តក្នុងពេលតែមួយ។ នៅក្នុងរូបមន្តបុរាណ SLAM ត្រូវបានចាត់ទុកថាជាបញ្ហាប៉ាន់ស្មានប្រូបាប៊ីលីតេ ជាមួយនឹងក្រុមគ្រួសារទូទៅរួមទាំងវិធីសាស្រ្តផ្អែកលើ EKF និងវិធីសាស្រ្តផ្អែកលើតម្រងភាគល្អិត។ [1]
ជាធម្មតារ៉ូបូតរួមបញ្ចូលគ្នា៖
-
អូដូមេទ្រីកង់ (ការតាមដានជាមូលដ្ឋាន)
-
ការផ្គូផ្គងស្កេន LiDAR ឬចំណុចសម្គាល់ដែលមើលឃើញ
-
IMU (ការបង្វិល/ការបង្កើនល្បឿន)
-
GPS (ក្រៅផ្ទះ មានដែនកំណត់)
មនុស្សយន្តមិនអាចត្រូវបានកំណត់ទីតាំងបានល្អឥតខ្ចោះជានិច្ចនោះទេ ដូច្នេះជង់ល្អៗធ្វើសកម្មភាពដូចជាមនុស្សធំ៖ តាមដានភាពមិនប្រាកដប្រជា រកឃើញការរសាត់បាត់ និងត្រលប់ទៅរកឥរិយាបថដែលមានសុវត្ថិភាពជាងមុននៅពេលដែលទំនុកចិត្តធ្លាក់ចុះ។.
ការធ្វើផែនការ និងការធ្វើការសម្រេចចិត្ត៖ ការជ្រើសរើសអ្វីដែលត្រូវធ្វើបន្ទាប់
នៅពេលដែលមនុស្សយន្តមានរូបភាពដែលអាចអនុវត្តបាននៃពិភពលោក វាត្រូវសម្រេចចិត្តថាត្រូវធ្វើអ្វី។ ការធ្វើផែនការច្រើនតែបង្ហាញជាពីរស្រទាប់៖
-
ការធ្វើផែនការក្នុងស្រុក (ប្រតិកម្មរហ័ស) ⚡
ជៀសវាងឧបសគ្គ បន្ថយល្បឿននៅជិតមនុស្ស ដើរតាមគន្លងផ្លូវ/ច្រករបៀង។ -
ការធ្វើផែនការសកល (រូបភាពធំជាង) 🧭
ជ្រើសរើសគោលដៅ ផ្លូវជុំវិញតំបន់ដែលត្រូវបានរារាំង កំណត់ពេលភារកិច្ច។
នៅក្នុងការអនុវត្តជាក់ស្តែង នេះជាកន្លែងដែលមនុស្សយន្តប្រែក្លាយ "ខ្ញុំគិតថាខ្ញុំឃើញផ្លូវច្បាស់លាស់" ទៅជាពាក្យបញ្ជាចលនាជាក់ស្តែង ដែលនឹងមិនកាត់ជ្រុងធ្នើរ ឬរសាត់ចូលទៅក្នុងកន្លែងផ្ទាល់ខ្លួនរបស់មនុស្សឡើយ។.
ការគ្រប់គ្រង៖ ប្រែក្លាយផែនការទៅជាចលនារលូន
ប្រព័ន្ធត្រួតពិនិត្យបំលែងសកម្មភាពដែលបានគ្រោងទុកទៅជាចលនាពិត ខណៈពេលដែលដោះស្រាយជាមួយនឹងការរំខានក្នុងពិភពពិតដូចជា៖
-
ការកកិត
-
ការផ្លាស់ប្តូរបន្ទុក
-
ទំនាញផែនដី
-
ការពន្យាពេលម៉ូទ័រ និងប្រតិកម្មតបវិញ
ឧបករណ៍ទូទៅរួមមាន PID ការគ្រប់គ្រង ផ្អែកលើគំរូ ការគ្រប់គ្រង ព្យាករណ៍គំរូ និង ចលនវិទ្យាបញ្ច្រាស សម្រាប់ដៃ ពោលគឺគណិតវិទ្យាដែលប្រែក្លាយ "ដាក់ឧបករណ៍ក្តាប់ នៅទីនោះ " ទៅជាចលនាសន្លាក់។ [2]
វិធីមានប្រយោជន៍មួយដើម្បីគិតអំពីវា៖
ការធ្វើផែនការជ្រើសរើសផ្លូវមួយ។
ការគ្រប់គ្រងធ្វើឱ្យមនុស្សយន្តពិតជាដើរតាមវាដោយមិនរង្គើ ហោះលើសល្បឿន ឬញ័រដូចរទេះទិញទំនិញដែលមានជាតិកាហ្វេអ៊ីននោះទេ។
ការរៀនសូត្រ៖ របៀបដែលមនុស្សយន្តមានភាពប្រសើរឡើងជំនួសឱ្យការត្រូវបានសរសេរកម្មវិធីឡើងវិញជារៀងរហូត
មនុស្សយន្តអាចកែលម្អបានដោយការរៀនពីទិន្នន័យជាជាងការលៃតម្រូវដោយដៃបន្ទាប់ពីការផ្លាស់ប្តូរបរិស្ថាននីមួយៗ។.
វិធីសាស្រ្តសិក្សាសំខាន់ៗរួមមាន៖
-
ការរៀនសូត្រដែលមានការត្រួតពិនិត្យ 📚៖ រៀនពីឧទាហរណ៍ដែលមានស្លាក (ឧទាហរណ៍ “នេះជាបន្ទះឈើ”)។
-
ការរៀនសូត្រដោយខ្លួនឯង 🔍៖ រៀនរចនាសម្ព័ន្ធពីទិន្នន័យឆៅ (ឧទាហរណ៍ ការទស្សន៍ទាយស៊ុមនាពេលអនាគត)។
-
ការរៀនសូត្រពង្រឹងសមត្ថភាព 🎯៖ រៀនសកម្មភាពដោយបង្កើនសញ្ញារង្វាន់ឱ្យបានអតិបរមាតាមពេលវេលា (ជារឿយៗត្រូវបានហ៊ុមព័ទ្ធដោយភ្នាក់ងារ បរិស្ថាន និងផលចំណេញ)។ [3]
កន្លែងដែល RL ភ្លឺស្វាង៖ ការរៀនឥរិយាបថស្មុគស្មាញ ដែលការរចនាឧបករណ៍បញ្ជាដោយដៃគឺជារឿងឈឺចាប់។
កន្លែងដែល RL កាន់តែមានភាពទាក់ទាញ៖ ប្រសិទ្ធភាពទិន្នន័យ សុវត្ថិភាពអំឡុងពេលរុករក និងចន្លោះប្រហោង sim-to-real។
អន្តរកម្មរវាងមនុស្ស និងមនុស្សយន្ត៖ បញ្ញាសិប្បនិម្មិត (AI) ដែលជួយមនុស្សយន្តធ្វើការជាមួយមនុស្ស
ចំពោះមនុស្សយន្តនៅក្នុងផ្ទះ ឬកន្លែងធ្វើការ អន្តរកម្មមានសារៈសំខាន់។ បញ្ញាសិប្បនិម្មិត (AI) អនុញ្ញាតឱ្យ៖
-
ការស្គាល់សំឡេង (សំឡេង → ពាក្យ)
-
ការរកឃើញចេតនា (ពាក្យ → អត្ថន័យ)
-
ការយល់ដឹងអំពីកាយវិការ (ចង្អុល ភាសាកាយវិការ)
នេះស្តាប់ទៅសាមញ្ញរហូតដល់អ្នកផ្ញើវា៖ មនុស្សមិនស៊ីសង្វាក់គ្នា ការសង្កត់សំឡេងខុសគ្នា បន្ទប់មានសំឡេងរំខាន ហើយពាក្យ «នៅទីនោះ» មិនមែនជាស៊ុមសម្របសម្រួលទេ។.
ទំនុកចិត្ត សុវត្ថិភាព និង «កុំធ្វើជាមនុស្សគួរឲ្យខ្លាច»៖ ផ្នែកដែលមិនសូវសប្បាយ ប៉ុន្តែសំខាន់
មនុស្សយន្តគឺជាប្រព័ន្ធ AI ដែលមាន ផលវិបាកខាងរូបវន្ត ដូច្នេះការជឿទុកចិត្ត និងការអនុវត្តសុវត្ថិភាពមិនអាចជារឿងបន្ទាប់បន្សំបានទេ។
រន្ទាសុវត្ថិភាពជាក់ស្តែងច្រើនតែរួមមាន៖
-
តាមដានទំនុកចិត្ត/ភាពមិនប្រាកដប្រជា
-
ឥរិយាបថអភិរក្សនិយមនៅពេលដែលការយល់ឃើញធ្លាក់ចុះ
-
សកម្មភាពកត់ត្រាសម្រាប់ការបំបាត់កំហុស និងការធ្វើសវនកម្ម
-
ព្រំដែនច្បាស់លាស់លើអ្វីដែលមនុស្សយន្តអាចធ្វើបាន
មធ្យោបាយកម្រិតខ្ពស់ដ៏មានប្រយោជន៍មួយដើម្បីកំណត់រឿងនេះគឺការគ្រប់គ្រងហានិភ័យ៖ ការគ្រប់គ្រង ការកំណត់ផែនទីហានិភ័យ ការវាស់វែងហានិភ័យ និងការគ្រប់គ្រងវានៅទូទាំងវដ្តជីវិត ដែលស្របនឹងរបៀបដែល NIST រៀបចំរចនាសម្ព័ន្ធការគ្រប់គ្រងហានិភ័យ AI ឱ្យកាន់តែទូលំទូលាយ។ [4]
និន្នាការ "គំរូធំ"៖ មនុស្សយន្តដែលប្រើប្រាស់គំរូគ្រឹះ
គំរូមូលនិធិកំពុងជំរុញឆ្ពោះទៅរកឥរិយាបថមនុស្សយន្តដែលមានគោលបំណងទូទៅជាងមុន ជាពិសេសនៅពេលដែលភាសា ចក្ខុវិស័យ និងសកម្មភាពត្រូវបានធ្វើគំរូរួមគ្នា។.
ឧទាហរណ៍មួយនៃទិសដៅគឺ ចក្ខុវិស័យ-ភាសា-សកម្មភាព (VLA) ដែលប្រព័ន្ធមួយត្រូវបានបណ្តុះបណ្តាលឱ្យភ្ជាប់អ្វីដែលវាឃើញ + អ្វីដែលវាត្រូវបានប្រាប់ឱ្យធ្វើ + សកម្មភាពអ្វីដែលវាគួរធ្វើ។ RT-2 គឺជាឧទាហរណ៍ដែលត្រូវបានដកស្រង់យ៉ាងទូលំទូលាយនៃរចនាប័ទ្មនៃវិធីសាស្ត្រនេះ។ [5]
ផ្នែកដ៏គួរឱ្យរំភើប៖ ការយល់ដឹងកាន់តែមានភាពបត់បែន និងកម្រិតខ្ពស់។
ការត្រួតពិនិត្យការពិត៖ ភាពជឿជាក់នៃពិភពរូបវន្តនៅតែទាមទាររបាំងការពារ - ការប៉ាន់ស្មានបែបបុរាណ ការរឹតបន្តឹងសុវត្ថិភាព និងការគ្រប់គ្រងបែបអភិរក្សមិនបាត់ទៅណាឡើយ ដោយសារតែមនុស្សយន្តអាច "និយាយបានឆ្លាតវៃ"។
សុន្ទរកថាចុងក្រោយ
ដូច្នេះ តើ មនុស្សយន្តប្រើប្រាស់ AI យ៉ាងដូចម្តេច? មនុស្សយន្តប្រើប្រាស់ AI ដើម្បី យល់ឃើញ ប៉ាន់ស្មាន ស្ថានភាព (តើខ្ញុំនៅឯណា?) រៀបចំផែនការ និង គ្រប់គ្រង - ហើយជួនកាល រៀន ពីទិន្នន័យដើម្បីកែលម្អ។ AI អនុញ្ញាតឱ្យមនុស្សយន្តដោះស្រាយភាពស្មុគស្មាញនៃបរិស្ថានថាមវន្ត ប៉ុន្តែភាពជោគជ័យអាស្រ័យលើប្រព័ន្ធដែលអាចទុកចិត្តបាន និងអាចវាស់វែងបានជាមួយនឹងឥរិយាបថសុវត្ថិភាពជាមុនសិន។
សំណួរដែលសួរញឹកញាប់
តើមនុស្សយន្តប្រើប្រាស់ AI ដើម្បីដំណើរការដោយស្វ័យភាពយ៉ាងដូចម្តេច?
មនុស្សយន្តប្រើប្រាស់បញ្ញាសិប្បនិម្មិត (AI) ដើម្បីដំណើរការរង្វិលជុំស្វ័យភាពជាបន្តបន្ទាប់៖ ស្វែងយល់ពីពិភពលោក បកស្រាយអ្វីដែលកំពុងកើតឡើង រៀបចំផែនការជំហានបន្ទាប់ដែលមានសុវត្ថិភាព ធ្វើសកម្មភាពតាមរយៈម៉ូទ័រ និងរៀនពីទិន្នន័យ។ នៅក្នុងការអនុវត្ត នេះគឺជាគំនរនៃសមាសធាតុដែលធ្វើការរួមគ្នាជាជាងគំរូ "វេទមន្ត" មួយ។ គោលបំណងគឺឥរិយាបថដែលអាចទុកចិត្តបាននៅក្នុងបរិស្ថានដែលកំពុងផ្លាស់ប្តូរ មិនមែនជាការបង្ហាញម្តងម្កាលក្រោមលក្ខខណ្ឌល្អឥតខ្ចោះនោះទេ។.
តើ AI មនុស្សយន្តគ្រាន់តែជាគំរូមួយ ឬជាជង់ស្វ័យភាពពេញលេញ?
នៅក្នុងប្រព័ន្ធភាគច្រើន បញ្ញាសិប្បនិម្មិតរបស់មនុស្សយន្តគឺជាជង់ពេញលេញមួយ៖ ការយល់ឃើញ ការប៉ាន់ស្មានស្ថានភាព ការធ្វើផែនការ និងការគ្រប់គ្រង។ ការរៀនម៉ាស៊ីនជួយជាមួយនឹងភារកិច្ចដូចជាចក្ខុវិស័យ និងការទស្សន៍ទាយ ខណៈពេលដែលការរឹតបន្តឹងរូបវិទ្យា និងការគ្រប់គ្រងបែបបុរាណរក្សាចលនាឱ្យមានស្ថេរភាព និងអាចទស្សន៍ទាយបាន។ ការដាក់ពង្រាយពិតប្រាកដជាច្រើនប្រើវិធីសាស្រ្តចម្រុះ ពីព្រោះភាពជឿជាក់មានសារៈសំខាន់ជាងភាពឆ្លាតវៃ។ នោះហើយជាមូលហេតុដែលការរៀន "vibes-only" កម្រនឹងរស់រានមានជីវិតនៅខាងក្រៅការកំណត់ដែលបានគ្រប់គ្រង។.
តើមនុស្សយន្ត AI ពឹងផ្អែកលើឧបករណ៍ចាប់សញ្ញា និងគំរូនៃការយល់ឃើញអ្វីខ្លះ?
មនុស្សយន្ត AI ជារឿយៗរួមបញ្ចូលគ្នានូវកាមេរ៉ា LiDAR ឧបករណ៍ចាប់សញ្ញាជម្រៅ មីក្រូហ្វូន IMU ឧបករណ៍អ៊ិនកូដឌ័រ និងឧបករណ៍ចាប់សញ្ញាកម្លាំង/កម្លាំងបង្វិលជុំ ឬឧបករណ៍ចាប់សញ្ញាប៉ះ។ គំរូការយល់ឃើញប្រែក្លាយចរន្តទាំងនេះទៅជាសញ្ញាដែលអាចប្រើបានដូចជាអត្តសញ្ញាណវត្ថុ ឥរិយាបថ ទំហំទំនេរ និងសញ្ញាចលនា។ ការអនុវត្តជាក់ស្តែងល្អបំផុតគឺការបញ្ចេញទំនុកចិត្ត ឬភាពមិនប្រាកដប្រជា មិនមែនគ្រាន់តែស្លាកនោះទេ។ ភាពមិនប្រាកដប្រជានោះអាចណែនាំផែនការដែលមានសុវត្ថិភាពជាងមុន នៅពេលដែលឧបករណ៍ចាប់សញ្ញាចុះខ្សោយដោយសារពន្លឺចាំង ភាពព្រិល ឬភាពរញ៉េរញ៉ៃ។.
តើ SLAM នៅក្នុងមនុស្សយន្តជាអ្វី ហើយហេតុអ្វីបានជាវាសំខាន់?
SLAM (ទីតាំង និងការធ្វើផែនទីក្នុងពេលដំណាលគ្នា) ជួយមនុស្សយន្តបង្កើតផែនទី ខណៈពេលដែលប៉ាន់ស្មានទីតាំងរបស់វាក្នុងពេលតែមួយ។ វាជាចំណុចកណ្តាលសម្រាប់មនុស្សយន្តដែលធ្វើចលនាជុំវិញ និងត្រូវការរុករកដោយមិន "ភ័យស្លន់ស្លោ" នៅពេលដែលលក្ខខណ្ឌផ្លាស់ប្តូរ។ ការបញ្ចូលធម្មតារួមមាន odometry កង់, IMU និង LiDAR ឬចំណុចសម្គាល់ចក្ខុវិស័យ ជួនកាល GPS នៅខាងក្រៅ។ ជង់ល្អតាមដានការរសាត់ និងភាពមិនប្រាកដប្រជា ដូច្នេះមនុស្សយន្តអាចមានឥរិយាបថអភិរក្សជាងមុន នៅពេលដែលទីតាំងមានភាពរង្គោះរង្គើ។.
តើការធ្វើផែនការមនុស្សយន្ត និងការគ្រប់គ្រងមនុស្សយន្តខុសគ្នាយ៉ាងដូចម្តេច?
ការធ្វើផែនការសម្រេចថាមនុស្សយន្តគួរធ្វើអ្វីបន្ទាប់ ដូចជាការជ្រើសរើសគោលដៅ ការបង្វែរផ្លូវជុំវិញឧបសគ្គ ឬការជៀសវាងមនុស្ស។ ការគ្រប់គ្រងប្រែក្លាយផែនការនោះទៅជាចលនារលូន និងមានស្ថេរភាព ទោះបីជាមានការកកិត ការផ្លាស់ប្តូរបន្ទុក និងការពន្យារពេលម៉ូទ័រក៏ដោយ។ ការធ្វើផែនការច្រើនតែត្រូវបានបែងចែកជាការធ្វើផែនការសកល (ផ្លូវរូបភាពធំ) និងការធ្វើផែនការក្នុងស្រុក (ប្រតិកម្មលឿននៅជិតឧបសគ្គ)។ ការគ្រប់គ្រងជាទូទៅប្រើឧបករណ៍ដូចជា PID ការគ្រប់គ្រងផ្អែកលើគំរូ ឬការគ្រប់គ្រងព្យាករណ៍គំរូ ដើម្បីអនុវត្តតាមផែនការប្រកបដោយភាពជឿជាក់។.
តើមនុស្សយន្តដោះស្រាយភាពមិនប្រាកដប្រជា ឬទំនុកចិត្តទាបដោយសុវត្ថិភាពយ៉ាងដូចម្តេច?
មនុស្សយន្តដែលរចនាបានល្អចាត់ទុកភាពមិនប្រាកដប្រជាថាជាធាតុចូលមួយចំពោះឥរិយាបថ មិនមែនជាអ្វីដែលត្រូវមើលរំលងនោះទេ។ នៅពេលដែលទំនុកចិត្តលើការយល់ឃើញ ឬការធ្វើមូលដ្ឋានីយកម្មធ្លាក់ចុះ វិធីសាស្រ្តទូទៅមួយគឺបន្ថយល្បឿន បង្កើនរឹមសុវត្ថិភាព ឈប់ដោយសុវត្ថិភាព ឬស្នើសុំជំនួយពីមនុស្សជំនួសឱ្យការទាយ។ ប្រព័ន្ធក៏កត់ត្រាសកម្មភាព និងបរិបទផងដែរ ដូច្នេះឧប្បត្តិហេតុអាចធ្វើសវនកម្មបាន និងងាយស្រួលជួសជុលជាង។ ផ្នត់គំនិត "បរាជ័យដ៏ប្រណិត" នេះគឺជាភាពខុសគ្នាស្នូលរវាងការបង្ហាញ និងមនុស្សយន្តដែលអាចដាក់ពង្រាយបាន។.
តើពេលណាដែលការរៀនពង្រឹងមានប្រយោជន៍សម្រាប់មនុស្សយន្ត ហើយអ្វីដែលធ្វើឱ្យវាពិបាក?
ការរៀនពង្រឹងត្រូវបានប្រើជាញឹកញាប់សម្រាប់ជំនាញស្មុគស្មាញដូចជាការរៀបចំ ឬចលនា ដែលការរចនាឧបករណ៍បញ្ជាដោយដៃគឺពិបាក។ វាអាចរកឃើញឥរិយាបថដែលមានប្រសិទ្ធភាពតាមរយៈការសាកល្បង និងកំហុសដែលជំរុញដោយរង្វាន់ ជាញឹកញាប់នៅក្នុងការក្លែងធ្វើ។ ការដាក់ពង្រាយមានភាពស្មុគស្មាញ ពីព្រោះការរុករកអាចមិនមានសុវត្ថិភាព ទិន្នន័យអាចមានតម្លៃថ្លៃ ហើយគម្លាតស៊ីមទៅពិតអាចបំបែកគោលនយោបាយ។ បំពង់បង្ហូរជាច្រើនប្រើ RL ជាជម្រើស រួមជាមួយនឹងការរឹតបន្តឹង និងការគ្រប់គ្រងបែបបុរាណសម្រាប់សុវត្ថិភាព និងស្ថេរភាព។.
តើគំរូគ្រឹះកំពុងផ្លាស់ប្តូររបៀបដែលមនុស្សយន្តប្រើប្រាស់ AI ដែរឬទេ?
វិធីសាស្រ្តគំរូមូលដ្ឋានកំពុងជំរុញមនុស្សយន្តឆ្ពោះទៅរកឥរិយាបថធ្វើតាមការណែនាំទូទៅជាងមុន ជាពិសេសជាមួយនឹងគំរូចក្ខុវិស័យ-ភាសា-សកម្មភាព (VLA) ដូចជាប្រព័ន្ធរចនាប័ទ្ម RT-2។ ចំណុចវិជ្ជមានគឺភាពបត់បែន៖ ភ្ជាប់អ្វីដែលមនុស្សយន្តឃើញជាមួយនឹងអ្វីដែលវាត្រូវបានប្រាប់ឱ្យធ្វើ និងរបៀបដែលវាគួរធ្វើសកម្មភាព។ ការពិតគឺថាការប៉ាន់ស្មានបែបបុរាណ ការរឹតបន្តឹងសុវត្ថិភាព និងការគ្រប់គ្រងអភិរក្សនៅតែមានសារៈសំខាន់សម្រាប់ភាពជឿជាក់ខាងរូបវន្ត។ ក្រុមជាច្រើនបានកំណត់រឿងនេះថាជាការគ្រប់គ្រងហានិភ័យវដ្តជីវិត ដែលមានលក្ខណៈស្រដៀងគ្នាទៅនឹងក្របខ័ណ្ឌដូចជា AI RMF របស់ NIST។.
ឯកសារយោង
[1] Durrant-Whyte & Bailey -
ការធ្វើមូលដ្ឋានីយកម្ម និងការធ្វើផែនទីក្នុងពេលដំណាលគ្នា (SLAM): ផ្នែកទី I ក្បួនដោះស្រាយសំខាន់ៗ (PDF) [2] Lynch & Park -
មនុស្សយន្តទំនើប៖ មេកានិច ការធ្វើផែនការ និងការគ្រប់គ្រង (PDF បោះពុម្ពជាមុន) [3] Sutton & Barto -
ការរៀនសូត្រពង្រឹង៖ សេចក្តីផ្តើម (សេចក្តីព្រាង PDF លើកទី 2) [4] NIST -
ក្របខ័ណ្ឌគ្រប់គ្រងហានិភ័យបញ្ញាសិប្បនិម្មិត (AI RMF 1.0) (PDF) [5] Brohan et al. - RT-2: គំរូសកម្មភាពចក្ខុវិស័យ-ភាសា-ផ្ទេរចំណេះដឹងគេហទំព័រទៅការគ្រប់គ្រងមនុស្សយន្ត (arXiv)