តម្រូវការផ្ទុកទិន្នន័យសម្រាប់ AI៖ អ្វីដែលអ្នកពិតជាត្រូវដឹង

បញ្ញាសិប្បនិម្មិត (AI) មិនមែនគ្រាន់តែជាគំរូដ៏ទាក់ទាញ ឬជំនួយការនិយាយដែលធ្វើត្រាប់តាមមនុស្សនោះទេ។ នៅពីក្រោយរឿងទាំងអស់នោះ មានទិន្នន័យជាច្រើន - ជួនកាលជាមហាសមុទ្រ -។ ហើយនិយាយឱ្យត្រង់ទៅ ការរក្សាទុកទិន្នន័យនោះ? នោះហើយជាកន្លែងដែលអ្វីៗតែងតែរញ៉េរញ៉ៃ។ មិនថាអ្នកកំពុងនិយាយអំពីបំពង់ចែកចាយការស្គាល់រូបភាព ឬការបណ្តុះបណ្តាលគំរូភាសាយក្សនោះទេ តម្រូវការផ្ទុកទិន្នន័យសម្រាប់បញ្ញាសិប្បនិម្មិត (AI) អាចវិលចេញពីការគ្រប់គ្រងយ៉ាងឆាប់រហ័ស ប្រសិនបើអ្នកមិនគិតវាឱ្យបានហ្មត់ចត់។ ចូរយើងពន្យល់ពីមូលហេតុដែលការផ្ទុកគឺជាសត្វសាហាវបែបនេះ តើមានជម្រើសអ្វីខ្លះនៅលើតុ និងរបៀបដែលអ្នកអាចរៀបចំថ្លៃដើម ល្បឿន និងមាត្រដ្ឋានដោយមិនចាំបាច់អស់កម្លាំង។

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 វិទ្យាសាស្ត្រទិន្នន័យ និងបញ្ញាសិប្បនិម្មិត៖ អនាគតនៃការច្នៃប្រឌិត
ស្វែងយល់ពីរបៀបដែល AI និងវិទ្យាសាស្ត្រទិន្នន័យជំរុញការច្នៃប្រឌិតទំនើប។

🔗 បញ្ញារាវសិប្បនិម្មិត៖ អនាគតនៃ AI និងទិន្នន័យវិមជ្ឈការ
រកមើលទិន្នន័យ AI វិមជ្ឈការ និងការច្នៃប្រឌិតដែលកំពុងលេចចេញ។

🔗 ការគ្រប់គ្រងទិន្នន័យសម្រាប់ឧបករណ៍ AI ដែលអ្នកគួរតែមើល
យុទ្ធសាស្ត្រសំខាន់ៗដើម្បីកែលម្អការផ្ទុកទិន្នន័យ AI និងប្រសិទ្ធភាព។

🔗 ឧបករណ៍ AI ល្អបំផុតសម្រាប់អ្នកវិភាគទិន្នន័យ៖ បង្កើនការសម្រេចចិត្តក្នុងការវិភាគ
ឧបករណ៍ AI កំពូលដែលជំរុញការវិភាគទិន្នន័យ និងការសម្រេចចិត្ត។

ដូច្នេះ… តើអ្វីធ្វើឱ្យការផ្ទុកទិន្នន័យ AI ល្អ? ✅

វាមិនមែនគ្រាន់តែជា "តេរ៉ាបៃបន្ថែមទៀត" នោះទេ។ ការផ្ទុកទិន្នន័យដែលងាយស្រួលប្រើដោយ AI ពិតប្រាកដគឺនិយាយអំពីការប្រើប្រាស់ បាន អាចទុកចិត្តបាន និងមានល្បឿនលឿនគ្រប់គ្រាន់ សម្រាប់ទាំងការហ្វឹកហាត់ និងបន្ទុកការងារសន្និដ្ឋាន។

ចំណុចសំខាន់មួយចំនួនគួរកត់សម្គាល់៖

លទ្ធភាពធ្វើមាត្រដ្ឋាន៖ លោតពី GBs ទៅ PBs ដោយមិនចាំបាច់សរសេរស្ថាបត្យកម្មរបស់អ្នកឡើងវិញ។
ដំណើរការ៖ ភាពយឺតយ៉ាវខ្ពស់នឹងធ្វើឱ្យ GPU អស់កម្លាំង; ពួកវាមិនអត់ឱនចំពោះបញ្ហាកកស្ទះនោះទេ។
Redundancy៖ រូបថត ថតចម្លង កំណែទម្រង់ - ដោយសារការពិសោធន៍ខូច ហើយមនុស្សក៏ធ្វើដែរ។
ប្រសិទ្ធភាពនៃការចំណាយ៖ កម្រិតត្រឹមត្រូវ ពេលវេលាត្រឹមត្រូវ; បើមិនដូច្នេះទេ វិក័យប័ត្រនេះលួចបន្លំដូចជាសវនកម្មពន្ធ។
ភាពជិតក្នុងការគណនា៖ ដាក់កន្លែងផ្ទុកនៅជាប់ GPUs/TPUs ឬមើលការបញ្ជូនទិន្នន័យ។

បើមិនដូច្នេះទេ វាដូចជាការព្យាយាមបើកឡាន Ferrari លើម៉ាស៊ីនកាត់ស្មៅ - តាមបច្ចេកទេសវាផ្លាស់ទី ប៉ុន្តែមិនយូរទេ។

តារាងប្រៀបធៀប៖ ជម្រើសផ្ទុកទូទៅសម្រាប់ AI

ប្រភេទការផ្ទុក	សមល្អបំផុត	ទីលានបាល់ថ្លៃដើម	ហេតុអ្វីបានជាវាដំណើរការ (ឬមិនដំណើរការ)
ការផ្ទុកវត្ថុតាមពពក	ការចាប់ផ្ដើមអាជីវកម្ម និងទំហំមធ្យម	$$ (អថេរ)	អាចបត់បែនបាន ប្រើប្រាស់បានយូរ ល្អឥតខ្ចោះសម្រាប់ទិន្នន័យបឹង; ប្រយ័ត្ន ថ្លៃ egress + ស្នើសុំ hits ។
NAS នៅនឹងកន្លែង	អង្គការធំជាងជាមួយក្រុម IT	$$$$	ភាពយឺតយ៉ាវដែលអាចព្យាករណ៍បាន ការគ្រប់គ្រងពេញលេញ; ថ្លៃដើម capex + ការចំណាយដែលកំពុងដំណើរការ។
ពពកកូនកាត់	ការអនុលោមតាម - ការដំឡើងធ្ងន់	$$$	រួមបញ្ចូលគ្នានូវល្បឿនក្នុងតំបន់ជាមួយនឹងពពកយឺត; Orchestration បន្ថែមការឈឺក្បាល។
All-Flash Arrays	អ្នកស្រាវជ្រាវដែលជក់ចិត្ត	$$$$$	IOPS/throughput លឿនគួរឱ្យអស់សំណើច; ប៉ុន្តែ TCO មិនមែនជារឿងកំប្លែងទេ។
ប្រព័ន្ធឯកសារចែកចាយ	ចង្កោម AI devs / HPC	$$–$$$	ប៉ារ៉ាឡែល I/O នៅមាត្រដ្ឋានធ្ងន់ធ្ងរ (Lustre, Spectrum Scale); បន្ទុក ops គឺពិត។

ហេតុអ្វីបានជាតម្រូវការទិន្នន័យ AI កំពុងផ្ទុះឡើង 🚀

AI មិនមែនគ្រាន់តែរក្សាទុកការថតរូប Selfie ទេ។ វាសាហាវណាស់។

សំណុំបណ្តុះបណ្តាល៖ ILSVRC របស់ ImageNet តែមួយគត់មានរូបភាពដែលមានស្លាកប្រហែល 1.2 លាន ហើយសាជីវកម្មជាក់លាក់តាមដែនមានលក្ខណៈលើសពីនេះ [1]។
ការដាក់កំណែ៖ រាល់ការកែប្រែ - ស្លាក ការបំបែក ការបន្ថែម - បង្កើត "សច្ចភាព" មួយទៀត។
ការបញ្ចូលស្ទ្រីម៖ ចក្ខុវិស័យផ្ទាល់ ទូរមាត្រ ចំណីឧបករណ៍ចាប់សញ្ញា... វាជាបំពង់ពន្លត់អគ្គីភ័យឥតឈប់ឈរ។
ទម្រង់ដែលមិនមានរចនាសម្ព័ន្ធ៖ អត្ថបទ វីដេអូ អូឌីយ៉ូ កំណត់ហេតុ - ផ្លូវធំជាងតារាង SQL ស្អាត។

វាជាអាហារប៊ូហ្វេដែលអ្នកអាចញ៉ាំបានទាំងអស់ ហើយម៉ូដែលតែងតែត្រលប់មកញ៉ាំបង្អែមវិញ។

Cloud vs On-Premises: ការជជែកដេញដោលគ្មានទីបញ្ចប់ 🌩️🏢

ពពកមើលទៅគួរឱ្យទាក់ទាញ៖ ស្ទើរតែគ្មានដែនកំណត់ សកល បង់ប្រាក់តាមការប្រើប្រាស់។ រហូតដល់វិក្កយបត្ររបស់អ្នកបង្ហាញ ការគិតថ្លៃចេញ - ហើយភ្លាមៗនោះការផ្ទុក "ថោក" របស់អ្នកត្រូវចំណាយលើការចំណាយលើការគណនា [2]។

ម៉្យាងវិញទៀត On-prem ផ្តល់នូវការគ្រប់គ្រង និងដំណើរការរឹងមាំ ប៉ុន្តែអ្នកក៏កំពុងចំណាយលើផ្នែករឹង ថាមពល ភាពត្រជាក់ និងមនុស្សសម្រាប់ទូដាក់កៅអីទារកផងដែរ។

ក្រុមភាគច្រើនតាំងលំនៅកណ្តាលរញ៉េរញ៉ៃ៖ ការរៀបចំរក្សាទិន្នន័យក្តៅ រសើប និងបញ្ជូនខ្ពស់នៅជិត GPUs ហើយទុកក្នុងប័ណ្ណសារដែលនៅសល់ក្នុងកម្រិតពពក។ កូនកាត់ ។

តម្លៃស្តុកឡើងកប់ 💸

សមត្ថភាពគឺគ្រាន់តែជាស្រទាប់ផ្ទៃ។ ការចំណាយលាក់កំបាំង៖

ចលនាទិន្នន័យ៖ ច្បាប់ចម្លងអន្តរតំបន់ ការផ្ទេរឆ្លងកាត់ពពក សូម្បីតែអ្នកប្រើប្រាស់ [2] ។
Redundancy: ធ្វើតាម 3-2-1 (បីច្បាប់ចម្លង មេឌៀពីរ មួយនៅក្រៅបណ្តាញ) ស៊ីកន្លែងទំនេរ ប៉ុន្តែរក្សាទុកថ្ងៃ [3] ។
ថាមពល និងប្រព័ន្ធត្រជាក់៖ ប្រសិនបើវាជារ៉ាក់របស់អ្នក វាជាបញ្ហាកម្ដៅរបស់អ្នក។
ការដោះដូរភាពយឺតយ៉ាវ៖ ថ្នាក់ថោកជាងជាធម្មតាមានន័យថាល្បឿននៃការស្តារផ្ទាំងទឹកកក។

សុវត្ថិភាព និងការអនុលោមតាមច្បាប់៖ អ្នកបំបែកកិច្ចព្រមព្រៀងស្ងាត់ 🔒

បទប្បញ្ញត្តិអាចកំណត់បានយ៉ាងពិតប្រាកដថាបៃស្ថិតនៅកន្លែងណា។ ក្រោម GDPR របស់ចក្រភពអង់គ្លេសការផ្លាស់ប្តូរទិន្នន័យផ្ទាល់ខ្លួនចេញពីចក្រភពអង់គ្លេសតម្រូវឱ្យមានផ្លូវផ្ទេរស្របច្បាប់ (SCCs, IDTAs ឬច្បាប់គ្រប់គ្រាន់)។ ការបកប្រែ៖ ការរចនាការផ្ទុករបស់អ្នកត្រូវតែ "ដឹង" ពីភូមិសាស្ត្រ [5]។

មូលដ្ឋានគ្រឹះនៃការដុតនំពីថ្ងៃទីមួយ៖

ការអ៊ិនគ្រីប - ទាំងការសម្រាកនិងការធ្វើដំណើរ។
ការចូលប្រើសិទ្ធិតិចបំផុត + ផ្លូវសវនកម្ម។
លុបការការពារ ដូចជាភាពមិនប្រែប្រួល ឬការចាក់សោវត្ថុ។

ឧបសគ្គនៃការអនុវត្ត៖ ភាពយឺតយ៉ាវគឺជាឃាតករស្ងាត់ ⚡

GPU មិនចូលចិត្តការរង់ចាំទេ។ ប្រសិនបើការផ្ទុកមានភាពយឺតយ៉ាវ ពួកវាគឺជាឧបករណ៍កម្តៅដ៏រុងរឿង។ ឧបករណ៍ដូចជា NVIDIA GPUDirect Storage កាត់បន្ថយអន្តរការី CPU ដោយដឹកជញ្ជូនទិន្នន័យដោយផ្ទាល់ពី NVMe ទៅអង្គចងចាំ GPU - ពិតជាអ្វីដែលការបណ្តុះបណ្តាលទ្រង់ទ្រាយធំចង់បាន [4]។

ការជួសជុលទូទៅ៖

NVMe all-flash សម្រាប់ឧបករណ៍ហ្វឹកហាត់ក្តៅ។
ប្រព័ន្ធឯកសារប៉ារ៉ាឡែល (Lustre, Spectrum Scale) សម្រាប់ការបញ្ជូនតាមថ្នាំងជាច្រើន។
Async loaders ជាមួយនឹងការ sharding + prefetch ដើម្បីរក្សា GPUs ពីការទុកចោល។

ការផ្លាស់ប្តូរជាក់ស្តែងសម្រាប់ការគ្រប់គ្រងការផ្ទុក AI 🛠️

កម្រិត៖ បន្ទះក្តៅនៅលើ NVMe/SSD; បណ្ណសារ stale កំណត់ទៅជាវត្ថុ ឬស្រទាប់ត្រជាក់។
Dedup + delta: រក្សាទុកមូលដ្ឋានទិន្នន័យម្តង រក្សាទុកតែ diffs + manifests។
ច្បាប់វដ្តជីវិត៖ កម្រិតដោយស្វ័យប្រវត្តិ និងផុតកំណត់ទិន្នផលចាស់ [2] ។
ភាពធន់ 3-2-1៖ តែងតែរក្សាច្បាប់ចម្លងជាច្រើន ឆ្លងកាត់ប្រព័ន្ធផ្សព្វផ្សាយផ្សេងៗគ្នា ដោយមួយដាច់ដោយឡែក [3] ។
ឧបករណ៍៖ តាមដានការបញ្ជូនបន្ត, ភាពយឺតយ៉ាវ p95/p99, ការអានដែលបរាជ័យ, កើនឡើងតាមបន្ទុកការងារ។

ករណីរហ័ស (បង្កើតឡើងប៉ុន្តែធម្មតា) 📚

ក្រុមចក្ខុវិស័យចាប់ផ្តើមជាមួយ ~20 TB នៅក្នុងកន្លែងផ្ទុកវត្ថុលើពពក។ ក្រោយមក ពួកគេចាប់ផ្តើមក្លូនសំណុំទិន្នន័យនៅទូទាំងតំបន់សម្រាប់ការពិសោធន៍។ ការចំណាយរបស់ពួកគេប៉េងប៉ោង - មិនមែនមកពីកន្លែងផ្ទុកដោយខ្លួនវានោះទេ ប៉ុន្តែបានមកពី ចរាចរណ៍ចេញចូល។ ពួកវាផ្លាស់ប្តូរ shards ក្តៅទៅ NVMe នៅជិតចង្កោម GPU រក្សាច្បាប់ចម្លង Canonical នៅក្នុងកន្លែងផ្ទុកវត្ថុ (ជាមួយច្បាប់វដ្តជីវិត) ហើយកំណត់តែគំរូដែលពួកគេត្រូវការ។ លទ្ធផល៖ GPUs កាន់តែមមាញឹក វិក្កយបត្រកាន់តែធូរស្រាល ហើយអនាម័យទិន្នន័យមានភាពប្រសើរឡើង។

ការរៀបចំផែនការសមត្ថភាពស្រោមសំបុត្រ 🧮

រូបមន្តរសើបសម្រាប់ការប៉ាន់ស្មាន៖

សមត្ថភាព ≈ (សំណុំទិន្នន័យឆៅ) × (កត្តាចម្លង) + (ទិន្នន័យដែលបានដំណើរការមុន / បន្ថែម) + (ចំណុចត្រួតពិនិត្យ + កំណត់ហេតុ) + (រឹមសុវត្ថិភាព ~15–30%)

បន្ទាប់មកអនាម័យពិនិត្យមើលវាប្រឆាំងនឹងការហូរចូល។ ប្រសិនបើអ្នកផ្ទុកក្នុងមួយថ្នាំងត្រូវការ ~ 2-4 GB/s ទ្រទ្រង់ អ្នកកំពុងសម្លឹងមើល NVMe ឬ FS ស្របគ្នាសម្រាប់ផ្លូវក្តៅ ជាមួយនឹងការផ្ទុកវត្ថុជាការពិត។

វាមិនមែនគ្រាន់តែអំពីលំហទេ📊

នៅពេលដែលមនុស្សនិយាយថា តម្រូវការផ្ទុកទិន្នន័យ AIពួកគេស្រមៃឃើញ terabytes ឬ petabytes។ ប៉ុន្តែល្បិចពិតប្រាកដគឺតុល្យភាព៖ ថ្លៃដើមទល់នឹងដំណើរការ ភាពបត់បែនទល់នឹងការអនុលោមតាម នវានុវត្តន៍ទល់នឹងស្ថេរភាព។ ទិន្នន័យ AI នឹងមិនរួញតូចក្នុងពេលឆាប់ៗនេះទេ។ ក្រុមដែលបញ្ចូលការផ្ទុកទិន្នន័យទៅក្នុងការរចនាគំរូតាំងពីដំបូងជៀសវាងការលង់ក្នុងវាលភក់ទិន្នន័យ - ហើយពួកគេបញ្ចប់ការបណ្តុះបណ្តាលលឿនជាងមុនផងដែរ។

ឯកសារយោង

[1] Russakovsky et al. បញ្ហាប្រឈមនៃការទទួលស្គាល់រូបភាពទ្រង់ទ្រាយធំរបស់ ImageNet (IJCV) — មាត្រដ្ឋានសំណុំទិន្នន័យ និងបញ្ហាប្រឈម។ តំណភ្ជាប់
[2] AWS — តម្លៃ និងថ្លៃដើមរបស់ Amazon S3 (ការផ្ទេរទិន្នន័យ ការចាកចេញ កម្រិតវដ្តជីវិត)។ តំណភ្ជាប់
[3] CISA — ការណែនាំអំពីច្បាប់បម្រុងទុក 3-2-1។ តំណភ្ជាប់
[4] ឯកសារ NVIDIA — ទិដ្ឋភាពទូទៅនៃការផ្ទុក GPUDirect។ តំណភ្ជាប់
[5] ICO — ច្បាប់ GDPR របស់ចក្រភពអង់គ្លេសស្តីពីការផ្ទេរទិន្នន័យអន្តរជាតិ។ តំណភ្ជាប់

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ