តើការបង្កើនទំហំ AI ខុសពីវិធីសាស្ត្រប្តូរទំហំបែបប្រពៃណីយ៉ាងដូចម្តេច?

ការបង្កើនគុណភាពបង្ហាញដោយ AI ព្យាករណ៍ពីព័ត៌មានលម្អិតដែលមានគុណភាពបង្ហាញខ្ពស់ដែលបាត់ពីលំនាំដែលមានស្រាប់នៅក្នុងរូបភាព ជាជាងគ្រាន់តែលាតសន្ធឹងភីកសែលដូចវិធីសាស្ត្រប្រពៃណីដូចជា bicubic interpolation ធ្វើ។ នេះនាំឱ្យរូបភាពកាន់តែច្បាស់ និងលម្អិតជាងមុន។.

តើអ្វីទៅជាវត្ថុបុរាណទូទៅដែលខ្ញុំគួរតាមដាននៅពេលប្រើការបង្កើនទំហំដោយ AI?

វត្ថុបុរាណទូទៅរួមមាន ហាឡូជុំវិញគែម លំនាំវាយនភាពដដែលៗ ផ្ទៃរលោងពេក ឬមានក្រមួន និងអក្សរដែលប្រែក្លាយទៅជា 'ស្ទើរតែអក្សរ'។ វាជារឿងសំខាន់ក្នុងការតាមដានបញ្ហាទាំងនេះ ដើម្បីធានាបាននូវលទ្ធផលដែលមើលទៅធម្មជាតិ។.

ហេតុអ្វីបានជាមុខពេលខ្លះមើលទៅរលោងពេក ឬមិនប្រាកដនិយមពេកបន្ទាប់ពីការបង្កើនទំហំ?

មុខអាចមើលទៅរលោងពេកដោយសារតែការបំបាត់សំឡេងរំខាន និងការធ្វើឱ្យច្បាស់ខ្លាំង ដែលអាចលុបចេញនូវវាយនភាពដូចជារន្ធញើស។ ដើម្បីទទួលបានរូបរាងធម្មជាតិជាងមុន សូមពិចារណាកាត់បន្ថយការបន្ថយសំឡេងរំខាន និងការធ្វើឱ្យច្បាស់។.

តើខ្ញុំគួរធ្វើដូចម្តេចប្រសិនបើរូបភាពរបស់ខ្ញុំមើលទៅស្រួយៗ ឬមានសំឡេងរំខានច្រើនពេកបន្ទាប់ពីប្រើ AI upscaling?

ប្រសិនបើរូបភាពរបស់អ្នកមើលទៅស្រួយៗ សូមសាកល្បងកែតម្រូវគ្រាប់រំកិល denoise និង detail enhancement។ ការបន្ថែមគ្រាប់តូចៗក៏អាចជួយស្តារអារម្មណ៍ថតរូបឡើងវិញបានដែរ។.

តើគំរូ GAN និង CNN ប្រៀបធៀបគ្នាយ៉ាងដូចម្តេចក្នុងលទ្ធផលនៃការបង្កើនសមត្ថភាព AI?

ម៉ូដែល CNN ជាទូទៅមានស្ថេរភាព និងអាចព្យាករណ៍បាន ខណៈពេលដែលម៉ូដែល GAN ជារឿយៗផ្តល់នូវព័ត៌មានលម្អិតច្បាស់ជាង ប៉ុន្តែប្រឈមនឹងការដាក់បញ្ចូលធាតុមិនប្រាកដនិយម។ ការជ្រើសរើសរវាងពួកវាអាស្រ័យលើតម្រូវការរបស់អ្នកសម្រាប់ភាពប្រាកដនិយម ធៀបនឹងវាយនភាពប្រសើរឡើង។.

តើការបង្កើនគុណភាពរូបភាពដោយ AI សមស្របសម្រាប់ខ្លឹមសារវីដេអូដែរឬទេ ហើយតើវាបង្ហាញពីបញ្ហាប្រឈមអ្វីខ្លះ?

មែនហើយ ការបង្កើនគុណភាពរូបភាពដោយ AI គឺសមរម្យសម្រាប់វីដេអូ ប៉ុន្តែវាអាចជាបញ្ហាប្រឈមមួយ ពីព្រោះភាពស៊ីសង្វាក់គ្នានៅទូទាំងស៊ុមគឺមានសារៈសំខាន់ណាស់។ ព័ត៌មានលម្អិតភ្លឹបភ្លែតៗ ឬភ្លឺរលោងអាចរំខានអ្នកមើល ដូច្នេះវិធីសាស្ត្រឯកទេសដែលផ្តោតលើវីដេអូត្រូវបានណែនាំ។.

តើពេលណាដែលវាមិនសមរម្យក្នុងការពឹងផ្អែកលើការបង្កើនប្រសិទ្ធភាព AI?

ការបង្កើនប្រសិទ្ធភាព AI គួរតែត្រូវបានប្រើប្រាស់ដោយប្រុងប្រយ័ត្ននៅក្នុងសេណារីយ៉ូដែលមានហានិភ័យខ្ពស់ ដូចជាសារព័ត៌មាន ឬការវិភាគកោសល្យវិច្ច័យ ដែលភាពត្រឹមត្រូវមានសារៈសំខាន់។ វាត្រូវបានចាត់ទុកថាជាការបង្កើនប្រសិទ្ធភាពជាជាងភស្តុតាងច្បាស់លាស់ ហើយតម្លាភាពអំពីដំណើរការ AI គឺមានសារៈសំខាន់។.

តើខ្ញុំគួរចងចាំអ្វីខ្លះនៅពេលបង្កើនទំហំរូបភាពដែលបានបង្ហាប់ខ្លាំង?

សម្រាប់រូបភាពដែលត្រូវបានបង្ហាប់ខ្លាំង សូមចាប់ផ្តើមជាមួយនឹងការដកយកវត្ថុបុរាណចេញ ដើម្បីកាត់បន្ថយការស្ទះដែលមិនចង់បាន។ បន្ទាប់ពីនោះ អ្នកអាចបង្កើនទំហំ និងអនុវត្តការធ្វើឱ្យច្បាស់ដោយពន្លឺ ប្រសិនបើចាំបាច់ ដើម្បីរក្សាព័ត៌មានលម្អិតដោយមិនចាំបាច់ពង្រីកវត្ថុបុរាណដែលបានបង្ហាប់។.

តើការបង្កើនប្រសិទ្ធភាព AI ដំណើរការយ៉ាងដូចម្តេច

តើ AI Upscaling ដំណើរការយ៉ាងដូចម្តេច? [វីដេអូ និងសំណួរ]

ចម្លើយខ្លី៖ ការបង្កើនគុណភាពបង្ហាញដោយ AI ដំណើរការដោយការហ្វឹកហាត់គំរូលើរូបភាពដែលមានគុណភាពបង្ហាញទាប និងខ្ពស់ដែលបានផ្គូផ្គង បន្ទាប់មកប្រើវាដើម្បីទស្សន៍ទាយភីកសែលបន្ថែមដែលអាចទុកចិត្តបានក្នុងអំឡុងពេលបង្កើនគុណភាពបង្ហាញ។ ប្រសិនបើគំរូបានឃើញវាយនភាព ឬមុខស្រដៀងគ្នានៅក្នុងការហ្វឹកហាត់ វាអាចបន្ថែមព័ត៌មានលម្អិតដែលគួរឱ្យជឿជាក់។ បើមិនដូច្នោះទេ វាអាច "បំភាន់" វត្ថុបុរាណដូចជាហាឡូ ស្បែកដូចក្រមួន ឬភ្លឹបភ្លែតៗនៅក្នុងវីដេអូ។

ចំណុចសំខាន់ៗ៖

ការព្យាករណ៍៖ គំរូនេះបង្កើតព័ត៌មានលម្អិតដែលអាចទុកចិត្តបាន មិនមែនជាការកសាងឡើងវិញនូវការពិតដែលធានានោះទេ។

ជម្រើសម៉ូដែល៖ CNN មានទំនោរមានស្ថេរភាពជាង; GAN អាចមើលទៅច្បាស់ជាង ប៉ុន្តែមានហានិភ័យក្នុងការបង្កើតលក្ខណៈពិសេស។

ការត្រួតពិនិត្យវត្ថុបុរាណ៖ ប្រយ័ត្នចំពោះហាឡូ វាយនភាពដដែលៗ "ស្ទើរតែជាអក្សរ" និងមុខប្លាស្ទិក។

ស្ថេរភាពវីដេអូ៖ ប្រើវិធីសាស្ត្រតាមពេលវេលា បើមិនដូច្នោះទេ អ្នកនឹងឃើញពន្លឺភ្លឹបភ្លែតៗ និងរសាត់ពីស៊ុមមួយទៅស៊ុមមួយ។

ការប្រើប្រាស់ដែលមានហានិភ័យខ្ពស់៖ ប្រសិនបើភាពត្រឹមត្រូវមានសារៈសំខាន់ សូមបង្ហាញអំពីដំណើរការ និងចាត់ទុកលទ្ធផលជាឧទាហរណ៍។

តើការបង្កើនទំហំ AI ដំណើរការយ៉ាងដូចម្តេច? រូបភាព Infographic។.

អ្នកប្រហែលជាធ្លាប់បានឃើញវាហើយ៖ រូបភាពតូចមួយដែលស្រួយៗប្រែទៅជាអ្វីមួយដែលស្រួយៗគ្រប់គ្រាន់ដើម្បីបោះពុម្ព ផ្សាយ ឬទម្លាក់ចូលទៅក្នុងបទបង្ហាញដោយមិនញញើត។ វាមានអារម្មណ៍ដូចជាការបន្លំ។ ហើយ - តាមរបៀបដ៏ល្អបំផុត - វាពិតជាដូច្នោះមែន 😅

ដូច្នេះ របៀបដែល AI Upscaling ដំណើរការ គឺអាស្រ័យទៅលើអ្វីមួយដែលជាក់លាក់ជាង “កុំព្យូទ័របង្កើនព័ត៌មានលម្អិត” (រលកដៃ) និងកាន់តែខិតជិត “គំរូមួយព្យាករណ៍រចនាសម្ព័ន្ធដែលមានគុណភាពបង្ហាញខ្ពស់ដែលអាចទុកចិត្តបានដោយផ្អែកលើគំរូដែលវាបានរៀនពីឧទាហរណ៍ជាច្រើន” (ការរៀនសូត្រជ្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ)។ ជំហានព្យាករណ៍នោះគឺជាហ្គេមទាំងមូល - ហើយវាជាមូលហេតុដែល AI Upscaling អាចមើលទៅគួរឱ្យភ្ញាក់ផ្អើល… ឬប្លាស្ទិកបន្តិច… ឬដូចជាឆ្មារបស់អ្នកដុះពុកមាត់បន្ថែម។

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 របៀបដែល AI ដំណើរការ
រៀនមូលដ្ឋានគ្រឹះនៃគំរូ ទិន្នន័យ និងការសន្និដ្ឋាននៅក្នុង AI។.

🔗 របៀបដែល AI រៀន
មើលពីរបៀបដែលទិន្នន័យបណ្តុះបណ្តាល និងមតិកែលម្អធ្វើអោយប្រសើរឡើងនូវដំណើរការគំរូតាមពេលវេលា។.

🔗 របៀបដែល AI រកឃើញភាពមិនប្រក្រតី
យល់ពីលំនាំមូលដ្ឋាន និងរបៀបដែល AI សម្គាល់ឥរិយាបថមិនប្រក្រតីយ៉ាងរហ័ស។.

🔗 របៀបដែល AI ព្យាករណ៍និន្នាការ
ស្វែងយល់ពីវិធីសាស្ត្រព្យាករណ៍ដែលសម្គាល់សញ្ញា និងព្យាករណ៍ពីតម្រូវការនាពេលអនាគត។.

របៀបដែល AI Upscaling ដំណើរការ៖ គំនិតស្នូល នៅក្នុងពាក្យប្រចាំថ្ងៃ 🧩

ការបង្កើនគុណភាពបង្ហាញមានន័យថាការបង្កើនគុណភាពបង្ហាញ៖ ភីកសែលកាន់តែច្រើន រូបភាពធំជាង។ ការបង្កើនគុណភាពបង្ហាញបែបប្រពៃណី (ដូចជា bicubic) ជាទូទៅលាតសន្ធឹងភីកសែល និងធ្វើឱ្យការផ្លាស់ប្តូររលូន (ការបញ្ចូលចន្លោះ Bicubic)។ វាល្អ ប៉ុន្តែវាមិនអាចបង្កើត ថ្មី - វាគ្រាន់តែបញ្ចូលចន្លោះប៉ុណ្ណោះ។

ការបង្កើនគុណភាពរូបភាពដោយ AI សាកល្បងអ្វីដែលដិតជាងនេះ (ហៅថា "គុណភាពបង្ហាញខ្ពស់" នៅក្នុងពិភពស្រាវជ្រាវ) (ការរៀនសូត្រយ៉ាងស៊ីជម្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ)៖

វាពិនិត្យមើលការបញ្ចូលដែលមានគុណភាពបង្ហាញទាប
ស្គាល់លំនាំ (គែម វាយនភាព លក្ខណៈពិសេសលើផ្ទៃមុខ ស្នាមអក្សរ ការត្បាញក្រណាត់...)
ព្យាករណ៍ពី រូបរាង របស់កំណែដែលមានគុណភាពបង្ហាញ ខ្ពស់
បង្កើតទិន្នន័យភីកសែលបន្ថែមដែលសមនឹងលំនាំទាំងនោះ

មិនមែន «ស្តារការពិតឡើងវិញយ៉ាងល្អឥតខ្ចោះ» ទេ ដូចជា «ធ្វើការស្មានដែលអាចទុកចិត្តបានខ្ពស់» (Image Super-Resolution Using Deep Convolutional Networks (SRCNN))។ ប្រសិនបើវាស្តាប់ទៅគួរឱ្យសង្ស័យបន្តិច អ្នកមិនខុសទេ - ប៉ុន្តែវាក៏ជាមូលហេតុដែលវាដំណើរការបានល្អដែរ 😄

ហើយមែនហើយ នេះមានន័យថា ការបង្កើនគុណភាពរូបភាពដោយ AI ជាទូទៅគឺជាការគ្រប់គ្រងការយល់ច្រឡំ… ប៉ុន្តែតាមរបៀបដែលមានផលិតភាព និងគោរពភីកសែល។.

តើអ្វីទៅដែលធ្វើឱ្យការបង្កើនទំហំដោយ AI មានលក្ខណៈល្អ? ✅🛠️

ប្រសិនបើអ្នកកំពុងវិនិច្ឆ័យឧបករណ៍បង្កើនប្រសិទ្ធភាព AI (ឬការកំណត់ជាមុន) នេះជាអ្វីដែលទំនងជាសំខាន់បំផុត៖

ការស្ដារឡើងវិញនូវព័ត៌មានលម្អិតដោយមិនចាំបាច់ចម្អិនច្រើនពេក
ការបង្កើនគុណភាពល្អបន្ថែមភាពក្រៀម និងរចនាសម្ព័ន្ធ មិនមែនជាសំឡេងក្រៀម ឬរន្ធញើសក្លែងក្លាយនោះទេ។
វិន័យគែម
បន្ទាត់ស្អាតនៅតែស្អាត។ ម៉ូដែលមិនល្អធ្វើឱ្យគែមរង្គើ ឬដុះចេញជារាងហាឡូ។
ភាពប្រាកដនិយមនៃវាយនភាព
សក់មិនគួរក្លាយជាស្នាមជក់លាបពណ៌ទេ។ ឥដ្ឋមិនគួរក្លាយជាត្រាលំនាំដដែលៗទេ។
ការដោះស្រាយសំឡេងរំខាន និងការបង្ហាប់
រូបភាពប្រចាំថ្ងៃជាច្រើនត្រូវបានបំលែងជា JPEG រហូតដល់ខូច។ ឧបករណ៍បង្កើនគុណភាពរូបភាពល្អមិនបង្កើនការខូចខាតនោះទេ (Real-ESRGAN)។
ការយល់ដឹងអំពីមុខ និងអក្សរ មុខ
និងអក្សរគឺជាកន្លែងដែលងាយស្រួលបំផុតក្នុងការរកឃើញកំហុស។ គំរូល្អៗប្រព្រឹត្តចំពោះពួកគេដោយថ្នមៗ (ឬមានរបៀបពិសេស)។
ភាពស៊ីសង្វាក់គ្នានៅទូទាំងស៊ុម (សម្រាប់វីដេអូ)
ប្រសិនបើព័ត៌មានលម្អិតភ្លឹបភ្លែតៗពីស៊ុមមួយទៅស៊ុមមួយ ភ្នែករបស់អ្នកនឹងស្រែក។ ការបង្កើនទំហំវីដេអូរស់ ឬស្លាប់ដោយសារស្ថេរភាពបណ្ដោះអាសន្ន (BasicVSR (CVPR 2021))។
ការគ្រប់គ្រងដែលសមហេតុផល
អ្នកចង់បានគ្រាប់រំកិលដែលផ្គូផ្គងទៅនឹងលទ្ធផលពិតប្រាកដ៖ ការលុបបំបាត់សំលេងរំខាន ការបំបាត់ភាពមិនច្បាស់ ការដកយកវត្ថុបុរាណ ការរក្សាគ្រាប់ធញ្ញជាតិ ការធ្វើឱ្យច្បាស់... របស់របរជាក់ស្តែង។

ច្បាប់ស្ងប់ស្ងាត់មួយដែលនៅតែត្រូវអនុវត្ត៖ ការបង្កើនគុណភាពរូបភាព "ល្អបំផុត" ជារឿយៗគឺជាអ្វីដែលអ្នកស្ទើរតែមិនកត់សម្គាល់។ វាមើលទៅដូចជាអ្នកមានកាមេរ៉ាល្អជាងតាំងពីដំបូង 📷✨

តារាងប្រៀបធៀប៖ ជម្រើសបង្កើនប្រសិទ្ធភាព AI ដ៏ពេញនិយម (និងអ្វីដែលវាល្អសម្រាប់) 📊🙂

ខាងក្រោមនេះជាការប្រៀបធៀបជាក់ស្តែង។ តម្លៃមានភាពមិនច្បាស់លាស់ដោយចេតនា ពីព្រោះឧបករណ៍ប្រែប្រួលទៅតាមអាជ្ញាប័ណ្ណ កញ្ចប់ តម្លៃកុំព្យូទ័រ និងរបស់របរសប្បាយៗទាំងអស់។.

ឧបករណ៍ / វិធីសាស្រ្ត	ល្អបំផុតសម្រាប់	អារម្មណ៍តម្លៃ	ហេតុអ្វីបានជាវាដំណើរការ (ប្រហែល)
ឧបករណ៍បង្កើនគុណភាពរូបភាពលើតុបែប Topaz (រូបថត Topaz, វីដេអូ Topaz)	រូបថត វីដេអូ លំហូរការងារងាយស្រួល	បង់ប្រាក់បែប	ម៉ូដែលទូទៅដ៏រឹងមាំ + ការលៃតម្រូវច្រើន មានទំនោរ "គ្រាន់តែដំណើរការ" ... ភាគច្រើន
លក្ខណៈពិសេសប្រភេទ "Super Resolution" របស់ Adobe (Adobe Enhance > Super Resolution)	អ្នកថតរូបរួចហើយនៅក្នុងប្រព័ន្ធអេកូឡូស៊ីនោះ	ការជាវ-y	ការកសាងឡើងវិញនូវព័ត៌មានលម្អិតរឹងមាំ ជាធម្មតាមានលក្ខណៈអភិរក្សនិយម (មិនសូវមានភាពទាក់ទាញ)
វ៉ារ្យ៉ង់ Real-ESRGAN / ESRGAN (Real-ESRGAN, ESRGAN)	ការងារ DIY, អ្នកអភិវឌ្ឍន៍, ការងារជាបាច់	ឥតគិតថ្លៃ (ប៉ុន្តែចំណាយពេលវេលា)	ពូកែខាងវាយនភាពលម្អិត អាចហឹរលើមុខប្រសិនបើអ្នកមិនប្រយ័ត្ន
របៀបបង្កើនគុណភាពសំឡេងដោយផ្អែកលើការសាយភាយ (SR3)	ការងារច្នៃប្រឌិត លទ្ធផលដែលមានរចនាប័ទ្ម	លាយ	អាចបង្កើតព័ត៌មានលម្អិតដ៏ស្រស់ស្អាត - ក៏អាចបង្កើតរឿងមិនសមហេតុផលផងដែរ ដូច្នេះ... មែនហើយ
ឧបករណ៍បង្កើនគុណភាពហ្គេម (រចនាប័ទ្ម DLSS/FSR) (Nvidia DLSS, AMD FSR 2)	ការលេងហ្គេម និងការបង្ហាញរូបភាពតាមពេលវេលាជាក់ស្តែង	កញ្ចប់	ប្រើប្រាស់ទិន្នន័យចលនា និងអាទិភាពដែលបានរៀន - ឈ្នះលើដំណើរការរលូន 🕹️
សេវាកម្មបង្កើនទំហំ Cloud	ភាពងាយស្រួល ជ័យជម្នះរហ័ស	បង់ប្រាក់សម្រាប់ការប្រើប្រាស់ម្តង	លឿន + អាចធ្វើមាត្រដ្ឋានបាន ប៉ុន្តែអ្នកអាចធ្វើពាណិជ្ជកម្មលើការគ្រប់គ្រង និងពេលខ្លះមានភាពប៉ិនប្រសប់
កម្មវិធីបង្កើនគុណភាពរូបភាពដោយ AI ដែលផ្តោតលើវីដេអូ (BasicVSR, Topaz Video)	វីដេអូចាស់ៗ, អានីមេ, បណ្ណសារ	បង់ប្រាក់បែប	ល្បិចពេលវេលាដើម្បីកាត់បន្ថយការភ្លឹបភ្លែតៗ + ម៉ូដែលវីដេអូឯកទេស
ការបង្កើនគុណភាពរូបភាព/រូបភាពតាមទូរស័ព្ទឆ្លាតវៃ	ការប្រើប្រាស់ធម្មតា	រួមបញ្ចូល	ម៉ូដែលទម្ងន់ស្រាលត្រូវបានកែសម្រួលសម្រាប់ទិន្នផលដ៏ពេញចិត្ត មិនមែនភាពល្អឥតខ្ចោះទេ (នៅតែងាយស្រួលប្រើ)

ការសារភាពអំពីការធ្វើទ្រង់ទ្រាយ quirk៖ “Paid-ish” កំពុងធ្វើការងារច្រើននៅក្នុងតារាងនោះ។ ប៉ុន្តែអ្នកយល់ពីគំនិតហើយ 😅

អាថ៌កំបាំងដ៏ធំ៖ តារាម៉ូដែលរៀនគូសផែនទីពីគុណភាពបង្ហាញទាបទៅគុណភាពបង្ហាញខ្ពស់ 🧠➡️🖼️

នៅក្នុងចំណុចស្នូលនៃការបង្កើនគុណភាពរូបភាពដោយប្រើបច្ចេកវិទ្យា AI ភាគច្រើនគឺការរៀបចំការរៀនដែលមានការត្រួតពិនិត្យ (Image Super-Resolution Using Deep Convolutional Networks (SRCNN))៖

ចាប់ផ្តើមជាមួយរូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ ("ការពិត")
បន្ថយពួកវាទៅជាកំណែដែលមានគុណភាពបង្ហាញទាប ("ការបញ្ចូល")
ហ្វឹកហាត់គំរូមួយដើម្បីកសាងឡើងវិញនូវគុណភាពបង្ហាញខ្ពស់ដើមពីគុណភាពបង្ហាញទាប

យូរៗទៅ គំរូនេះរៀនពីទំនាក់ទំនងដូចជា៖

«ភាពព្រិលៗបែបនេះនៅជុំវិញភ្នែកជាធម្មតាជាកម្មសិទ្ធិរបស់រោមភ្នែក»
"ចង្កោមភីកសែលនេះច្រើនតែបង្ហាញអក្សរ serif"
«ជម្រាលគែមនេះមើលទៅដូចជាខ្សែដំបូល មិនមែនជាសំឡេងរំខានចៃដន្យទេ»

វាមិនមែនជាការទន្ទេញចាំរូបភាពជាក់លាក់ណាមួយទេ (ក្នុងន័យសាមញ្ញ) វាកំពុងរៀនរចនាសម្ព័ន្ធស្ថិតិ (ការរៀនសូត្រស៊ីជម្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ)។ សូមគិតថាវាដូចជាការរៀនវេយ្យាករណ៍នៃវាយនភាព និងគែម។ មិនមែនជាវេយ្យាករណ៍កំណាព្យទេ ដូចជា… វេយ្យាករណ៍សៀវភៅណែនាំ IKEA 🪑📦 (ពាក្យប្រៀបធៀបមិនសមហេតុផល ប៉ុន្តែជិតគ្រប់គ្រាន់)។

ចំណុចសំខាន់ៗ៖ អ្វីដែលកើតឡើងក្នុងអំឡុងពេលសន្និដ្ឋាន (នៅពេលអ្នកធ្វើឱ្យប្រសើរឡើង) ⚙️✨

នៅពេលអ្នកបញ្ចូលរូបភាពទៅក្នុង AI upscaler ជាធម្មតាមាន pipeline ដូចនេះ៖

ការកែច្នៃជាមុន
- បម្លែងចន្លោះពណ៌ (ពេលខ្លះ)
- ធ្វើឱ្យតម្លៃភីកសែលមានលក្ខណៈធម្មតា
- តម្រៀបរូបភាពជាបំណែកៗប្រសិនបើវាធំ (ការត្រួតពិនិត្យការពិត VRAM 😭) (ឃ្លាំង Real-ESRGAN (ជម្រើសក្រឡាក្បឿង))
ការស្រង់ចេញលក្ខណៈពិសេស
- ស្រទាប់ដំបូងៗរកឃើញគែម ជ្រុង និងជម្រាល
- ស្រទាប់ជ្រៅៗរកឃើញលំនាំ៖ វាយនភាព រូបរាង សមាសធាតុផ្ទៃមុខ
ការកសាងឡើងវិញ
- ម៉ូដែលនេះបង្កើតផែនទីលក្ខណៈពិសេសដែលមានគុណភាពបង្ហាញខ្ពស់ជាង
- បន្ទាប់មកបម្លែងវាទៅជាទិន្នផលភីកសែលពិតប្រាកដ
ការកែច្នៃក្រោយ
- ការធ្វើឱ្យច្បាស់ជាជម្រើស
- ការកាត់បន្ថយសំឡេងរំខានជាជម្រើស
- ការបង្ក្រាបវត្ថុបុរាណជាជម្រើស (សំឡេងរោទ៍ ហាឡូស ការរារាំង)

ព័ត៌មានលម្អិតដ៏ស្រទន់មួយ៖ ឧបករណ៍ជាច្រើនដែលមានទំហំធំជាងមុននៅក្នុងក្រឡាក្បឿង បន្ទាប់មកលាយថ្នេរ។ ឧបករណ៍ដ៏អស្ចារ្យលាក់ព្រំដែនក្រឡាក្បឿង។ ឧបករណ៍ Meh បន្សល់ទុកស្នាមក្រឡាចត្រង្គស្រអាប់ៗ ប្រសិនបើអ្នកសម្លឹងមើល។ ហើយបាទ/ចាស៎ អ្នកនឹងសម្លឹងមើល ពីព្រោះមនុស្សចូលចិត្តពិនិត្យមើលភាពមិនល្អឥតខ្ចោះតូចតាចនៅការពង្រីក 300% ដូចជាសត្វ Gremlins តូចៗ 🧌

គ្រួសារគំរូសំខាន់ៗដែលប្រើសម្រាប់ការបង្កើនប្រសិទ្ធភាព AI (និងមូលហេតុដែលពួកគេមានអារម្មណ៍ខុសគ្នា) 🤖📚

១) គុណភាពបង្ហាញខ្ពស់ដែលមានមូលដ្ឋានលើ CNN (ជាឧបករណ៍បុរាណ)

បណ្តាញសរសៃប្រសាទ Convolutional គឺពូកែខាងលំនាំក្នុងស្រុក៖ គែម វាយនភាព រចនាសម្ព័ន្ធតូចៗ (រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ដោយប្រើបណ្តាញ Convolutional ជ្រៅ (SRCNN))។

គុណសម្បត្តិ៖ លឿន មានស្ថេរភាព មានការភ្ញាក់ផ្អើលតិចជាងមុន
គុណវិបត្តិ៖ អាចមើលទៅហាក់ដូចជា "ដំណើរការ" បន្តិចប្រសិនបើត្រូវបានរុញច្រានខ្លាំង

2) ការបង្កើនគុណភាពរូបភាពដោយផ្អែកលើ GAN (រចនាប័ទ្ម ESRGAN) 🎭

GANs (Generative Adversarial Networks) បណ្តុះបណ្តាលម៉ាស៊ីនភ្លើងឱ្យផលិតរូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ ដែលឧបករណ៍រើសអើងមិនអាចបែងចែកពីរូបភាពពិតបាន (Generative Adversarial Networks)។

គុណសម្បត្តិ៖ ព័ត៌មានលម្អិតដ៏មុតស្រួច វាយនភាពគួរឱ្យចាប់អារម្មណ៍
ចំណុចអវិជ្ជមាន៖ អាចបង្កើតព័ត៌មានលម្អិតដែលមិនមាន - ពេលខ្លះខុស ពេលខ្លះចម្លែក (SRGAN, ESRGAN)

GAN អាចផ្តល់ឱ្យអ្នកនូវភាពច្បាស់ដែលគួរឱ្យភ្ញាក់ផ្អើល។ វាក៏អាចផ្តល់ឱ្យអ្នកនូវចិញ្ចើមបន្ថែមផងដែរ។ ដូច្នេះ... ជ្រើសរើសការប្រយុទ្ធរបស់អ្នក 😬

៣) ការបង្កើនទំហំដោយផ្អែកលើការសាយភាយ (តួអក្សរជំនួសច្នៃប្រឌិត) 🌫️➡️🖼️

ម៉ូដែលសាយភាយកាត់បន្ថយសំឡេងរំខានមួយជំហានម្តងៗ ហើយអាចត្រូវបានណែនាំដើម្បីបង្កើតព័ត៌មានលម្អិតដែលមានគុណភាពបង្ហាញខ្ពស់ (SR3)។

គុណសម្បត្តិ៖ អាចពូកែខាងព័ត៌មានលម្អិតគួរឱ្យជឿជាក់ ជាពិសេសសម្រាប់ការងារច្នៃប្រឌិត
ចំណុចអវិជ្ជមាន៖ អាចរសាត់ចេញពីអត្តសញ្ញាណ/រចនាសម្ព័ន្ធដើម ប្រសិនបើការកំណត់មានលក្ខណៈឈ្លានពាន (SR3)

នេះជាកន្លែងដែល “ការបង្កើនគុណភាពរូបភាព” ចាប់ផ្តើមលាយឡំជាមួយ “ការស្រមើស្រមៃឡើងវិញ”។ ពេលខ្លះនោះជាអ្វីដែលអ្នកចង់បាន។ ពេលខ្លះវាមិនមែនទេ។.

៤) ការបង្កើនគុណភាពវីដេអូជាមួយនឹងភាពស៊ីសង្វាក់គ្នាតាមពេលវេលា 🎞️

ការបង្កើនគុណភាពវីដេអូជារឿយៗបន្ថែមតក្កវិជ្ជាដែលដឹងពីចលនា៖

ប្រើស៊ុមជិតគ្នាដើម្បីធ្វើឱ្យលម្អិតមានស្ថេរភាព (BasicVSR (CVPR 2021))
ព្យាយាមជៀសវាងការភ្លឹបភ្លែតៗ និងវត្ថុបុរាណដែលវារ
ជារឿយៗផ្សំគុណភាពបង្ហាញខ្ពស់ជាមួយនឹង denoise និង deinterlacing (វីដេអូ Topaz)

ប្រសិនបើការបង្កើនទំហំរូបភាពគឺដូចជាការស្ដារគំនូរមួយឡើងវិញ ការបង្កើនទំហំវីដេអូគឺដូចជាការស្ដារសៀវភៅត្រឡប់ឡើងវិញដោយមិនធ្វើឱ្យច្រមុះរបស់តួអង្គផ្លាស់ប្តូររូបរាងរាល់ទំព័រ។ ដែលវាពិបាកជាងវាស្តាប់ទៅទៅទៀត។.

ហេតុអ្វីបានជាការបង្កើនប្រសិទ្ធភាព AI ពេលខ្លះមើលទៅដូចជាក្លែងក្លាយ (និងរបៀបសម្គាល់វា) 👀🚩

ការបង្កើនគុណភាពរូបភាពដោយ AI បរាជ័យក្នុងវិធីដែលអាចសម្គាល់បាន។ នៅពេលដែលអ្នករៀនលំនាំទាំងនោះ អ្នកនឹងឃើញវាគ្រប់ទីកន្លែង ដូចជាការទិញឡានថ្មី ហើយស្រាប់តែសម្គាល់ឃើញម៉ូដែលនោះនៅគ្រប់ផ្លូវ 😵💫

ប្រជាប្រិយប្រាប់ថា៖

លាបក្រមួន លើស្បែកមុខ (បំបាត់សំឡេងរំខាន + ធ្វើឲ្យរលោងពេក)
ហាឡូដែលមុតពេក ជុំវិញគែម (តំបន់ "ហួសកម្រិត" បុរាណ) (ការបញ្ចូលទ្វេភាគី)
វាយនភាពដដែលៗ (ជញ្ជាំងឥដ្ឋក្លាយជាលំនាំចម្លង-បិទភ្ជាប់)
ភាពផ្ទុយគ្នាតូចៗដ៏ស្រួយៗ ដែលស្រែកថា "ក្បួនដោះស្រាយ"
អត្ថបទខូចទ្រង់ទ្រាយ ដែលអក្សរក្លាយជាអក្សរស្ទើរតែទាំងស្រុង (ប្រភេទអាក្រក់បំផុត)
ការរសាត់បាត់ព័ត៌មានលម្អិត ដែលលក្ខណៈពិសេសតូចៗផ្លាស់ប្តូរបន្តិចបន្តួច ជាពិសេសនៅក្នុងលំហូរការងារផ្សព្វផ្សាយ (SR3)

ផ្នែកដ៏លំបាក៖ ពេលខ្លះវត្ថុបុរាណទាំងនេះមើលទៅ "ល្អជាង" គ្រាន់តែក្រឡេកមើលមួយភ្លែត។ ខួរក្បាលរបស់អ្នកចូលចិត្តភាពមុតស្រួច។ ប៉ុន្តែបន្ទាប់ពីមួយសន្ទុះ វាមានអារម្មណ៍ថា... ខុស។.

យុទ្ធសាស្ត្រល្អមួយគឺត្រូវពង្រីក ហើយពិនិត្យមើលថាតើវាមើលទៅធម្មជាតិឬអត់នៅចម្ងាយមើលធម្មតា។ ប្រសិនបើវាមើលទៅល្អត្រឹមតែពង្រីក 400% នោះមិនមែនជាជ័យជម្នះទេ នោះជាចំណង់ចំណូលចិត្ត 😅

របៀបដែល AI Upscaling ដំណើរការ៖ ផ្នែកបណ្តុះបណ្តាល ដោយមិនមានបញ្ហាគណិតវិទ្យា 📉🙂

ការបណ្តុះបណ្តាលម៉ូដែលដែលមានគុណភាពបង្ហាញខ្ពស់ជាធម្មតាពាក់ព័ន្ធនឹង៖

សំណុំទិន្នន័យដែលបានផ្គូផ្គង (ការបញ្ចូលដែលមានគុណភាពបង្ហាញទាប គោលដៅដែលមានគុណភាពបង្ហាញខ្ពស់) (រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ដោយប្រើបណ្តាញ Deep Convolutional (SRCNN))
មុខងារបាត់បង់ ដែលដាក់ទណ្ឌកម្មការកសាងឡើងវិញខុស (SRGAN)

ប្រភេទនៃការខាតបង់ធម្មតា៖

ការបាត់បង់ភីកសែល (L1/L2)
លើកទឹកចិត្តឱ្យមានភាពត្រឹមត្រូវ។ អាចបង្កើតលទ្ធផលទន់បន្តិច។
ការបាត់បង់ការយល់ឃើញ
ប្រៀបធៀបលក្ខណៈពិសេសដែលជ្រៅជាង (ដូចជា "តើវា មើលទៅ ស្រដៀងគ្នាទេ") ជាជាងភីកសែលពិតប្រាកដ (ការបាត់បង់ការយល់ឃើញ (Johnson et al., 2016))។
ការខាតបង់ដោយគូប្រជែង (GAN)
លើកទឹកចិត្តឲ្យមានភាពប្រាកដនិយម ជួនកាលដោយខាតបង់ភាពត្រឹមត្រូវតាមន័យត្រង់ (SRGAN, Generative Adversarial Networks)។

មានការអូសទាញឥតឈប់ឈរ៖

ធ្វើឱ្យវា ស្មោះត្រង់ នឹងច្បាប់ដើម
vs
ធ្វើឱ្យវា មើលទៅគួរឱ្យចាប់អារម្មណ៍

ឧបករណ៍ផ្សេងៗគ្នាស្ថិតនៅកន្លែងផ្សេងៗគ្នានៅលើវិសាលគមនោះ។ ហើយអ្នកប្រហែលជាចូលចិត្តមួយអាស្រ័យលើថាតើអ្នកកំពុងស្ដាររូបថតគ្រួសារឡើងវិញ ឬរៀបចំផ្ទាំងរូបភាពដែល "រូបរាងស្អាត" សំខាន់ជាងភាពត្រឹមត្រូវខាងកោសល្យវិច្ច័យ។.

លំហូរការងារជាក់ស្តែង៖ រូបថត ស្កែនចាស់ៗ អានីមេ និងវីដេអូ 📸🧾🎥

រូបថត (រូបបញ្ឈរ ទេសភាព រូបថតផលិតផល)

ការអនុវត្តល្អបំផុតជាធម្មតាគឺ៖

បន្ថយសំឡេងរំខានបន្តិចបន្តួចជាមុនសិន (បើចាំបាច់)
កម្រិតខ្ពស់ជាមួយនឹងការកំណត់អភិរក្ស
បន្ថែមគ្រាប់ធញ្ញជាតិមកវិញ ប្រសិនបើរបស់របរមានអារម្មណ៍ថារលោងពេក (មែនហើយ ពិតជាដូច្នោះមែន)

គ្រាប់ធញ្ញជាតិប្រៀបដូចជាអំបិល។ ច្រើនពេកអាចបំផ្លាញអាហារពេលល្ងាចបាន ប៉ុន្តែគ្មានអ្វីអាចធ្វើឲ្យមានរសជាតិរាបស្មើបន្តិចសោះឡើយ 🍟

ការស្កេនចាស់ៗ និងរូបភាពដែលបានបង្ហាប់យ៉ាងខ្លាំង

ទាំងនេះពិបាកជាង ពីព្រោះគំរូអាចចាត់ទុកប្លុកបង្ហាប់ជា "វាយនភាព"។
សាកល្បង៖

ការដកយក ឬ ការបំបាត់ចោលនូវវត្ថុបុរាណ
បន្ទាប់មកកម្រិតខ្ពស់
បន្ទាប់មក ការធ្វើឱ្យច្បាស់ស្រាលៗ (កុំច្រើនពេក... ខ្ញុំដឹង មនុស្សគ្រប់គ្នានិយាយបែបនោះ ប៉ុន្តែនៅតែ)

អានីមេ និង សិល្បៈបន្ទាត់

សិល្បៈបន្ទាត់ទទួលបានអត្ថប្រយោជន៍ពី៖

ម៉ូដែលដែលរក្សាគែមស្អាត
ការបំភាន់វាយនភាពដែលកាត់បន្ថយ ការបង្កើនទំហំ
អានីមេជារឿយៗមើលទៅអស្ចារ្យព្រោះរូបរាងមានភាពសាមញ្ញ និងស៊ីសង្វាក់គ្នា។ (សំណាងណាស់)

វីដេអូ

វីដេអូបន្ថែមជំហានបន្ថែម៖

លុបបំបាត់សំឡេងរំខាន
ឌឺអ៊ីនធឺឡេស (សម្រាប់ប្រភពជាក់លាក់)
លំដាប់ខ្ពស់
ការធ្វើឱ្យរលោង ឬស្ថេរភាពតាមពេលវេលា (BasicVSR (CVPR 2021))
ការណែនាំគ្រាប់ធញ្ញជាតិឡើងវិញជាជម្រើសសម្រាប់ភាពស្អិតជាប់

ប្រសិនបើអ្នករំលងភាពស៊ីសង្វាក់គ្នាតាមពេលវេលា អ្នកនឹងទទួលបានព័ត៌មានលម្អិតភ្លឹបភ្លែតៗ។ នៅពេលដែលអ្នកសម្គាល់ឃើញវា អ្នកមិនអាចមើលវាចេញបានទេ។ ដូចជាកៅអីដែលមានសំឡេងគ្រហឹមៗនៅក្នុងបន្ទប់ស្ងាត់មួយ 😖

ការជ្រើសរើសការកំណត់ដោយមិនចាំបាច់ទាយច្រើនពេក (សន្លឹកបន្លំតូចមួយ) 🎛️😵💫

នេះជាផ្នត់គំនិតចាប់ផ្តើមដ៏ល្អមួយ៖

ប្រសិនបើមុខមើលទៅដូចប្លាស្ទិក
សូមកាត់បន្ថយការបន្ថយសំឡេងរំខាន កាត់បន្ថយការធ្វើឱ្យច្បាស់ សូមសាកល្បងម៉ូដែល ឬរបៀបដែលថែរក្សាមុខ។
ប្រសិនបើវាយនភាពមើលទៅខ្លាំងពេក
សូមបន្ថយគ្រាប់រំកិល “ការបង្កើនលម្អិត” ឬ “សង្គ្រោះព័ត៌មានលម្អិត” សូមបន្ថែមគ្រាប់ធញ្ញជាតិស្រាលៗបន្ទាប់ពីនោះ។
ប្រសិនបើគែមភ្លឺ
សូមបន្ថយការធ្វើឱ្យច្បាស់ សូមពិនិត្យមើលជម្រើសទប់ស្កាត់ហាឡូ។
ប្រសិនបើរូបភាពមើលទៅហាក់ដូចជា "AI" ពេក
ចូរប្រើវិធីអភិរក្សនិយមជាង។ ពេលខ្លះចលនាដ៏ល្អបំផុតគឺគ្រាន់តែ... តិចជាង។

ដូចគ្នានេះដែរ៖ កុំបង្កើនទំហំរូបភាព 8x គ្រាន់តែដោយសារតែអ្នកអាចធ្វើបាន។ 2x ឬ 4x ស្អាតជារឿយៗជាចំណុចល្អបំផុត។ ក្រៅពីនេះ អ្នកកំពុងសុំឱ្យម៉ូដែលសរសេររឿងប្រឌិតអំពីភីកសែលរបស់អ្នក 📖😂

សីលធម៌ ភាពត្រឹមត្រូវ និងសំណួរឆ្គងៗអំពី «សច្ចភាព» 🧭😬

ការបង្កើនទំហំ AI ធ្វើឱ្យបន្ទាត់មួយព្រិលៗ៖

ការស្ដារឡើងវិញមានន័យថា ការស្ដារឡើងវិញនូវអ្វីដែលមាន
ការបង្កើនប្រសិទ្ធភាពមានន័យថាបន្ថែមអ្វីដែលមិនមែន

ជាមួយរូបថតផ្ទាល់ខ្លួន ជាធម្មតាវាល្អ (និងស្រស់ស្អាត)។ ជាមួយសារព័ត៌មាន ភស្តុតាងផ្លូវច្បាប់ រូបភាពវេជ្ជសាស្ត្រ ឬអ្វីក៏ដោយដែលភាពស្មោះត្រង់មានសារៈសំខាន់... អ្នកត្រូវប្រុងប្រយ័ត្ន (OSAC/NIST: មគ្គុទ្ទេសក៍ស្តង់ដារសម្រាប់ការគ្រប់គ្រងរូបភាពឌីជីថលកោសល្យវិច្ច័យ, គោលការណ៍ណែនាំ SWGDE សម្រាប់ការវិភាគរូបភាពកោសល្យវិច្ច័យ)។

ច្បាប់សាមញ្ញមួយ៖

ប្រសិនបើហានិភ័យខ្ពស់ សូមចាត់ទុកការបង្កើនទំហំ AI ជាឧទាហរណ៍ មិនមែនជារឿងច្បាស់លាស់នោះទេ។

ម្យ៉ាងទៀត ការបង្ហាញព័ត៌មានក៏សំខាន់ផងដែរនៅក្នុងបរិបទវិជ្ជាជីវៈ។ មិនមែនដោយសារតែ AI ជាអំពើអាក្រក់នោះទេ ប៉ុន្តែដោយសារតែទស្សនិកជនសមនឹងទទួលបានព័ត៌មានថាតើព័ត៌មានលម្អិតត្រូវបានសាងសង់ឡើងវិញ ឬចាប់យកបានឬអត់។ នោះគ្រាន់តែជា… ការគោរព។.

កំណត់ចំណាំបិទបញ្ចប់ និងការសង្ខេបរហ័ស 🧡✅

ដូច្នេះ របៀបដែល AI Upscaling ដំណើរការ គឺ៖ ម៉ូដែលរៀនពីរបៀបដែលព័ត៌មានលម្អិតដែលមានគុណភាពបង្ហាញខ្ពស់ មានទំនោរ ទាក់ទងនឹងលំនាំដែលមានគុណភាពបង្ហាញទាប បន្ទាប់មកព្យាករណ៍ពីភីកសែលបន្ថែមដែលអាចទុកចិត្តបានក្នុងអំឡុងពេល upscaling (ការរៀនសូត្រជ្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ)។ អាស្រ័យលើគ្រួសារម៉ូដែល (CNN, GAN, diffusion, video-temporal) ការព្យាករណ៍នោះអាចមានលក្ខណៈអភិរក្ស និងស្មោះត្រង់... ឬដិត និងពេលខ្លះមិនច្បាស់លាស់ 😅

សង្ខេបរហ័ស

ការបង្កើនទំហំបែបប្រពៃណីលាតសន្ធឹងភីកសែល (Bicubic interpolation)
ការបង្កើនគុណភាពរូបភាពដោយ AI ព្យាករណ៍ពីព័ត៌មានលម្អិតដែលបាត់ដោយប្រើលំនាំដែលបានរៀន (Image Super-Resolution Using Deep Convolutional Networks (SRCNN))
លទ្ធផលដ៏អស្ចារ្យកើតចេញពីគំរូត្រឹមត្រូវ + ការអត់ធ្មត់
សូមប្រយ័ត្នចំពោះហាឡូ ផ្ទៃដូចក្រមួន វាយនភាពដដែលៗ និងភ្លឹបភ្លែតៗនៅក្នុងវីដេអូ (BasicVSR (CVPR 2021))
ការបង្កើនគុណភាពរូបភាព (Upscaling) ជារឿយៗគឺជា "ការកសាងឡើងវិញដែលអាចទុកចិត្តបាន" មិនមែនជាការពិតដ៏ល្អឥតខ្ចោះនោះទេ (SRGAN, ESRGAN)

ប្រសិនបើអ្នកចង់បាន សូមប្រាប់ខ្ញុំពីអ្វីដែលអ្នកកំពុងធ្វើឱ្យប្រសើរឡើង (មុខ រូបថតចាស់ៗ វីដេអូ គំនូរជីវចល ការស្កេនអក្សរ) ហើយខ្ញុំនឹងស្នើយុទ្ធសាស្ត្រកំណត់ដែលមានទំនោរគេចពីគ្រោះថ្នាក់ទូទៅនៃ "រូបរាង AI" 🎯🙂

ឧទាហរណ៍ជាក់ស្តែង៖ ការបង្កើនទំហំរូបថតផលិតផលទីផ្សារចាស់ 📸

សេណារីយ៉ូ

ហាងលក់កាមេរ៉ាមួយទឹកតូចមួយមានរូបថតផលិតផលចំនួន ៤០ សន្លឹកដែលបាននាំចេញពីគេហទំព័រចាស់មួយក្នុងទទឹង ៨០០ ភីកសែល។ ម្ចាស់ចង់ប្រើប្រាស់វាឡើងវិញនៅលើទំព័រពាណិជ្ជកម្មអេឡិចត្រូនិកថ្មី ដែលទំហំរូបភាពដែលបានណែនាំគឺ ១៦០០ ភីកសែល។.

បញ្ហា៖ ការផ្លាស់ប្តូរទំហំធម្មតាធ្វើឱ្យកាមេរ៉ាមើលទៅទន់ ខណៈពេលដែលការបង្កើនទំហំដោយ AI យ៉ាងសកម្មអាចធ្វើឱ្យចំណុចទាញកៅស៊ូ លេខស៊េរី និងសញ្ញាសម្គាល់កែវថតមើលទៅក្លែងក្លាយគួរឱ្យសង្ស័យ។ នោះជារឿងសំខាន់ព្រោះអ្នកទិញពឹងផ្អែកលើព័ត៌មានលម្អិតទាំងនោះមុនពេលទិញ។.

គោលដៅមិនមែនដើម្បី "ស្តារ" ព័ត៌មានដែលបាត់ឱ្យល្អឥតខ្ចោះនោះទេ។ វាគឺដើម្បីបង្កើតរូបភាពបញ្ជីដែលស្អាតជាងមុន ខណៈពេលដែលរក្សាឯកសារដើមឱ្យអាចប្រើបាន ពីព្រោះការបង្កើនទំហំដោយ AI ព្យាករណ៍ពីព័ត៌មានលម្អិតដែលអាចទុកចិត្តបាន ជាជាងការធានាការពិត។.

អ្វីដែលដំណើរការការងារត្រូវការ

រូបថតផលិតផលដើម ល្អបំផុតគឺកំណែដែលបង្រួមតិចបំផុតដែលមាន

ទំហំទិន្នផលគោលដៅ ដូចជាការធ្វើមាត្រដ្ឋាន 2× ពីទទឹង 800px ដល់ 1,600px

ឧបករណ៍ ឬម៉ូដែលដែលមានការគ្រប់គ្រងដាច់ដោយឡែកសម្រាប់ការបន្ថយសំឡេងរំខាន ការធ្វើឱ្យច្បាស់ និងការដកយកវត្ថុបុរាណចេញ។

បញ្ជីត្រួតពិនិត្យសាមញ្ញសម្រាប់អក្សរ គែម ឡូហ្គោ វីស ប៊ូតុង គ្រាប់ស្បែក និងការឆ្លុះបញ្ចាំង

ថតឯកសារសម្រាប់ឯកសារដើម និងថតឯកសារដាច់ដោយឡែកសម្រាប់ការនាំចេញដែលបានកែសម្រួល ដូច្នេះគ្មានអ្វីត្រូវបានសរសេរជាន់ពីលើទេ

ឧទាហរណ៍នៃការណែនាំ

ប្រើការណែនាំប្រភេទនេះនៅពេលសាកល្បងឧបករណ៍បង្កើនប្រសិទ្ធភាព AI៖

បង្កើនទំហំរូបថតផលិតផលនេះ 2× សម្រាប់ការចុះបញ្ជីពាណិជ្ជកម្មអេឡិចត្រូនិក។ រក្សារូបរាងវត្ថុ ការដាក់ឡូហ្គោ សញ្ញាសម្គាល់កញ្ចក់ គែមប៊ូតុង និងវាយនភាពផ្ទៃឱ្យជិតនឹងរូបភាពដើមតាមដែលអាចធ្វើទៅបាន។ ប្រើការសម្អាតការបង្ហាប់ស្រាលៗ ការធ្វើឱ្យច្បាស់ទាប និងជៀសវាងការបង្កើតអក្សរបន្ថែម ស្នាមឆ្កូត ស្លាក លេខស៊េរី ឬព័ត៌មានលម្អិតតុបតែង។ រូបភាពចុងក្រោយគួរតែមើលទៅធម្មជាតិនៅទំហំទំព័រផលិតផលធម្មតា មិនមែនច្បាស់សិប្បនិម្មិតនៅការពង្រីក 400% ទេ។.

របៀបសាកល្បងវា

ចាប់ផ្តើមជាមួយរូបភាពចម្រុះចំនួនប្រាំ មុនពេលដំណើរការបាច់ទាំងមូល៖

រូបថតផលិតផលស្អាតមួយសន្លឹកដែលមានពន្លឺល្អ

រូបភាពដែលបានបង្ហាប់ដោយ JPEG មួយដែលមានភាពមិនច្បាស់លាស់

រូបថតមួយសន្លឹកដែលមានអក្សរតូចៗបោះពុម្ព ឬសញ្ញាសម្គាល់លើកញ្ចក់

រូបភាពងងឹតមួយជាមួយសំឡេងរំខាននៅក្នុងស្រមោល

រូបភាពមួយសន្លឹកដែលមានលោហៈ ឬកញ្ចក់ឆ្លុះបញ្ចាំង

បន្ទាប់ពីបង្កើនគុណភាពរូបភាពរួច សូមប្រៀបធៀបលទ្ធផលនីមួយៗទល់នឹងលទ្ធផលដើមនៅ 100% និង 200%។ ពិនិត្យមើលថាតើឈ្មោះម៉ាក មុខកាត់ វីស រន្ធ និងលំនាំវាយនភាពនៅតែត្រូវគ្នាឬអត់។ ប្រសិនបើម៉ូដែលបង្កើត "ស្ទើរតែជាអក្សរ" ឬស្នាមផ្ទៃក្លែងក្លាយ សូមបន្ថយការកំណត់ការធ្វើឱ្យច្បាស់ ឬការស្តារព័ត៌មានលម្អិតឡើងវិញ។.

លទ្ធផល

លទ្ធផលជាឧទាហរណ៍៖ ផ្អែកលើពេលវេលានៃការធ្វើតេស្តរូបភាពប្រាំមុន និងក្រោយពេលប្រើប្រាស់លំហូរការងារនេះ។.

ការសម្អាត និងការផ្លាស់ប្តូរទំហំដោយដៃចំណាយពេលប្រហែល ៩ នាទីក្នុងមួយរូបភាព ឬ ៤៥ នាទីសម្រាប់រូបភាពប្រាំ។.

លំហូរការងារដែលជំនួយដោយ AI បានចំណាយពេលប្រហែល 3 នាទីក្នុងមួយរូបភាព ឬ 15 នាទីសម្រាប់រូបភាពប្រាំ។.

នោះគឺជាការសន្សំបានប្រហែល 30 នាទីលើរូបភាពចំនួនប្រាំ ឬប្រហែល 4 ម៉ោងលើការប្រើប្រាស់រូបភាពចំនួន 40 សន្លឹក។.

លទ្ធផលនៃការត្រួតពិនិត្យគុណភាព៖ រូបភាពចំនួន ៤ ក្នុងចំណោម ៥ រូបភាពបានឆ្លងកាត់ការពិនិត្យលើកដំបូង។ រូបភាពមួយបានបរាជ័យ ដោយសារតែឧបករណ៍បង្កើនទំហំរូបភាពបានបង្ខូចទ្រង់ទ្រាយអក្សរតូចៗនៅលើកញ្ចក់ ដូច្នេះវាត្រូវបានដំណើរការឡើងវិញជាមួយនឹងការធ្វើឱ្យច្បាស់ទាបជាង និងគ្មានការបង្កើនគុណភាពអក្សរទេ។.

រង្វាស់ដ៏មានតម្លៃនៅទីនេះមិនមែនគ្រាន់តែ "មើលទៅច្បាស់ជាង" នោះទេ។ វាគឺ៖ តើមានរូបភាពប៉ុន្មានដែលឆ្លងកាត់ការពិនិត្យឡើងវិញដោយចំហៀងដោយគ្មានព័ត៌មានលម្អិតដែលបានបង្កើត?

អ្វីដែលអាចខុសបាន

ម៉ូដែលនេះអាចប្រែក្លាយធូលីដី ប្លុក JPEG ឬស្នាមឆ្កូតទៅជាវាយនភាព "ពិត"។.

អក្សរតូចៗអាចក្លាយជាអក្សរក្លែងក្លាយដែលមើលទៅគួរឱ្យជឿរហូតដល់អ្នកពង្រីកចូល។.

សំឡេងរំខានច្រើនពេកអាចធ្វើឱ្យកៅស៊ូ ស្បែក ឬដែកដែលបានដុសមើលទៅដូចក្រមួន។.

ការធ្វើឲ្យមុតខ្លាំងអាចបង្កើតជាហាឡូជុំវិញគែមផលិតផល។.

ការដំណើរការជាបាច់អាចលាក់បាំងកំហុស ដូច្នេះសូមពិនិត្យមើលគំរូមុនពេលនាំចេញអ្វីៗទាំងអស់។.

សម្រាប់ពាណិជ្ជកម្មអេឡិចត្រូនិក ច្បាប់ដែលមានសុវត្ថិភាពបំផុតគឺសាមញ្ញ៖ កុំប្រើ AI upscaling ដើម្បីលាក់ការខូចខាត ផ្លាស់ប្តូរស្ថានភាព ឬធ្វើឱ្យផលិតផលមើលទៅថ្មីជាងវាទៅទៀត។.

សម្ភារៈសិក្សាជាក់ស្តែង

ការបង្កើនគុណភាពរូបភាពដោយ AI ដំណើរការបានល្អបំផុតនៅពេលដែលអ្នកចាត់ទុកវាដូចជាជំហានបញ្ចប់ដែលគ្រប់គ្រងបាន មិនមែនជាប៊ូតុងជួសជុលវេទមន្តនោះទេ។ ប្រើការកំណត់ 2× អភិរក្សនិយម ពិនិត្យមើលព័ត៌មានលម្អិតដែលអ្នកទិញយកចិត្តទុកដាក់ និងរក្សារូបភាពដើម ដើម្បីឱ្យកំណែដែលបានកែសម្រួលនៅតែអាចទុកចិត្តបាន។.

ឧទាហរណ៍ក្នុងពិភពពិត៖ ការបង្កើនទំហំវីដេអូហ្វឹកហាត់ចាស់ដោយមិនធ្វើឱ្យវាភ្លឺចែងចាំង

សេណារីយ៉ូ

ក្រុមហ៊ុនបណ្តុះបណ្តាលតូចមួយមានវីដេអូបង្ហាញសុវត្ថិភាពរយៈពេល ៧ នាទីដែលថតក្នុងឆ្នាំ ២០១៤ ក្នុងកម្រិត 720p។ ខ្លឹមសារនៅតែមានតម្លៃ ប៉ុន្តែវីដេអូមើលទៅហាក់ដូចជាស្រទន់នៅលើគេហទំព័រថ្មីរបស់ក្រុមហ៊ុន ជាពិសេសនៅលើអេក្រង់កុំព្យូទ័រយួរដៃធំៗ។.

ក្រុមការងារចង់នាំចេញកំណែ 1080p ដ៏ស្អាតជាងមុនដោយមិនចាំបាច់ថតឡើងវិញ។ ហានិភ័យគឺថា ការបង្កើនទំហំរូបភាពដោយ AI យ៉ាងសកម្មអាចធ្វើឱ្យមុខមើលទៅដូចជាក្រមួន ប្រែក្លាយអក្សរនៅលើសញ្ញាទៅជា "ស្ទើរតែជាពាក្យ" ឬបង្កើតវាយនភាពភ្លឹបភ្លែតៗពីស៊ុមមួយទៅស៊ុមមួយ។.

គោលដៅមិនមែនធ្វើឱ្យវីដេអូមើលទៅថ្មីស្រឡាងនោះទេ។ វាគឺដើម្បីធ្វើឱ្យវាច្បាស់ជាងមុន មានស្ថេរភាពជាងមុន និងមិនសូវមានការបង្ហាប់ ខណៈពេលដែលរក្សាមុខរបស់គ្រូបង្វឹក ស្លាកសញ្ញាព្រមាន ចលនាដៃ និងព័ត៌មានលម្អិតអំពីឧបករណ៍ឱ្យនៅដដែលដូចវីដេអូដើម។.

អ្វីដែលដំណើរការការងារត្រូវការ

ឯកសារវីដេអូដើម មិនមែនទាញយកតាមប្រព័ន្ធផ្សព្វផ្សាយសង្គមដែលបានបង្ហាប់ទេ ប្រសិនបើអាច

ទំហំនាំចេញគោលដៅ ដូចជា 720p ទៅ 1080p ជាជាងលោតទៅ 4K ដោយផ្ទាល់

កម្មវិធីបង្កើនគុណភាពវីដេអូជាមួយនឹងជម្រើសកាត់បន្ថយសំឡេងរំខាន ការធ្វើឱ្យច្បាស់ ការជួសជុលការបង្ហាប់ និងភាពស៊ីសង្វាក់គ្នាតាមពេលវេលា

ឈុតសាកល្បងខ្លីមួយដែលមានមុខ ចលនា អត្ថបទ និងផ្ទៃលម្អិត

បញ្ជីត្រួតពិនិត្យសម្រាប់ភ្លឹបភ្លែតៗ ហាឡូ អក្សរខូចទ្រង់ទ្រាយ វាយនភាពផ្ទៃមុខ និងគែមដែលមានចលនា

ច្បាប់ចម្លងដែលបានរក្សាទុកនៃវីដេអូដើមសម្រាប់ការប្រៀបធៀប និងការបង្ហាញប្រសិនបើចាំបាច់

ឧទាហរណ៍នៃការណែនាំ

សូមប្រើការណែនាំប្រភេទនេះ មុនពេលដំណើរការវីដេអូពេញលេញ៖

បង្កើនគុណភាពវីដេអូហ្វឹកហាត់ 720p នេះដល់ 1080p។ ផ្តល់អាទិភាពដល់ចលនាធម្មជាតិ គែមដែលមានស្ថេរភាព អត្ថបទដែលមានស្រាប់ដែលអាចអានបាន និងវាយនភាពស្បែកប្រាកដនិយម។ ប្រើការជួសជុលការបង្ហាប់ស្រាល និងការធ្វើឱ្យច្បាស់ទាប។ កុំបង្កើតអត្ថបទ ឡូហ្គោ ស្លាក ស្នាមឆ្កូត ព័ត៌មានលម្អិតនៃមុខ ឬសញ្ញាសម្គាល់ឧបករណ៍ដែលបាត់។ ជៀសវាងពន្លឺចែងចាំងពីស៊ុមមួយទៅស៊ុមមួយ។ លទ្ធផលចុងក្រោយគួរតែមើលទៅច្បាស់ជាងនៅពេលមើលទំហំធម្មតា មិនមែនច្បាស់សិប្បនិម្មិតនៅពេលផ្អាក និងពង្រីកទេ។.

របៀបសាកល្បងវា

មុនពេលដំណើរការឯកសារពេញរយៈពេល ៧ នាទី សូមនាំចេញគំរូរយៈពេល ២០ វិនាទីដែលរួមមាន៖

ទឹកមុខរបស់គ្រូពេលកំពុងនិយាយ

ដៃមួយរំកិលឆ្លងកាត់ស៊ុម

ស្លាកសញ្ញាព្រមាន ឬអក្សរតូចៗដែលបានបោះពុម្ព

ផ្ទៃដែលមានវាយនភាព ដូចជាក្រណាត់ បេតុង ដែកលាប ឬផ្លាស្ទិច

ការរំកិលកាមេរ៉ា ឬចលនាញ័រណាមួយ

សូមទស្សនាគំរូពីរដង៖ ម្តងក្នុងល្បឿនធម្មតា និងម្តងទៀតផ្អាកមួយហ្វ្រេមៗ។ ក្នុងល្បឿនធម្មតា សូមរកមើលការភ្លឹបភ្លែតៗ វាយនភាពវារ ឬចលនាមិនធម្មតាជុំវិញគែម។ នៅពេលផ្អាក សូមប្រៀបធៀបកំណែដើម និងកំណែដែលបានបង្កើនទំហំ ដើម្បីពិនិត្យមើលថាតើអត្ថបទ ប៊ូតុង ឧបករណ៍ និងលក្ខណៈពិសេសនៃផ្ទៃមុខនៅតែត្រូវគ្នាឬអត់។.

លទ្ធផល

លទ្ធផលជាឧទាហរណ៍៖ ផ្អែកលើការកំណត់ពេលវេលាលើឈុតសាកល្បងមួយរយៈពេល 20 វិនាទី ហើយបន្ទាប់មកអនុវត្តការកំណត់ដូចគ្នាទៅនឹងវីដេអូរយៈពេល 7 នាទី។.

លំហូរការងារ “ផ្លាស់ប្តូរទំហំ និងភាពច្បាស់” ដោយដៃចំណាយពេលប្រហែល 35 នាទី រួមទាំងការនាំចេញ និងការពិនិត្យឡើងវិញ ប៉ុន្តែលទ្ធផលបានបង្ហាញពន្លឺចែងចាំងដែលអាចមើលឃើញនៅលើសក់របស់គ្រូបង្វឹក និងហាឡូជុំវិញសញ្ញាសុវត្ថិភាព។.

លំហូរការងារដែលមានជំនួយពី AI បានចំណាយពេលប្រហែល 55 នាទី រួមទាំងការនាំចេញសាកល្បង ប៉ុន្តែបានកាត់បន្ថយបញ្ហាពិនិត្យឡើងវិញពីបញ្ហាដែលអាចមើលឃើញចំនួន 8 នៅក្នុងការនាំចេញលើកដំបូង មកត្រឹមបញ្ហាតូចតាចចំនួន 2 នៅក្នុងការនាំចេញចុងក្រោយ។.

កំណែចុងក្រោយបានឆ្លងកាត់ការត្រួតពិនិត្យចំនួន 10 ក្នុងចំណោម 12 លើបញ្ជីត្រួតពិនិត្យ។ បញ្ហាពីរដែលនៅសល់គឺភាពទន់បន្តិចលើអត្ថបទផ្ទៃខាងក្រោយ និងសំឡេងរំខានស្រាលៗនៅជ្រុងងងឹតមួយ។ ទាំងពីរត្រូវបានទទួលយក ពីព្រោះគ្រូបង្វឹក ឧបករណ៍ និងជំហានសុវត្ថិភាពនៅតែស្របគ្នាខាងមើលឃើញ។.

រង្វាស់ដែលមានអត្ថន័យនៅទីនេះមិនមែនជា "សម្រេចបាន 1080p" ទេ។ វាគឺ៖ តើវីដេអូបង្ហាញវត្ថុបុរាណដែលរំខានប៉ុន្មានវិនាទីក្នុងអំឡុងពេលចាក់ឡើងវិញធម្មតា?

អ្វីដែលអាចខុសបាន

ម៉ូដែលនេះអាចធ្វើឱ្យប្លុកបង្ហាប់កាន់តែមុតស្រួច និងធ្វើឱ្យវាមើលទៅដូចជាវាយនភាពពិតប្រាកដ។.

អត្ថបទល្អៗអាចមើលទៅមានទំនុកចិត្តជាងមុន ប៉ុន្តែមិនសូវត្រឹមត្រូវទេ។.

មុខអាចរលោងពេក ប្រសិនបើកម្រិតសំឡេងរំខានខ្ពស់ពេក។.

គែមដែលកំពុងរំកិលអាចភ្លឺចែងចាំង ប្រសិនបើឧបករណ៍នេះដំណើរការស៊ុមនីមួយៗដោយឯករាជ្យពេក។.

ការនាំចេញ 4K អាចមើលទៅអាក្រក់ជាងការនាំចេញ 1080p ដែលមានការរឹតត្បិត ពីព្រោះម៉ូដែលត្រូវបង្កើតព័ត៌មានលម្អិតច្រើនពេក។.

កំហុសដ៏ធំបំផុតគឺការវិនិច្ឆ័យតែស៊ុមដែលផ្អាក។ ការបង្កើនមាត្រដ្ឋានវីដេអូត្រូវតែមើលទៅធម្មជាតិនៅពេលមានចលនា មិនមែនគ្រាន់តែគួរឱ្យចាប់អារម្មណ៍ជារូបភាពស្ងប់ស្ងាត់នោះទេ។.

សម្ភារៈសិក្សាជាក់ស្តែង

សម្រាប់វីដេអូ ការបង្កើនគុណភាពរូបភាពដោយ AI ដំណើរការបានល្អបំផុតនៅពេលអ្នកសាកល្បងផ្នែកខ្លីមួយជាមុនសិន រក្សាការបង្កើនគុណភាពរូបភាពឲ្យមធ្យម និងវិនិច្ឆ័យចលនាមុនភាពច្បាស់។ លទ្ធផលដែលទន់ជាងបន្តិច ប៉ុន្តែមានស្ថេរភាពជាធម្មតាល្អជាងកំណែច្បាស់ដែលភ្លឹបភ្លែតៗរាល់ពេលដែលនរណាម្នាក់ធ្វើចលនា។.

សំណួរដែលសួរញឹកញាប់

ការបង្កើនប្រសិទ្ធភាព AI និងរបៀបដែលវាដំណើរការ

ការបង្កើនគុណភាពបង្ហាញរូបភាពដោយ AI (ជារឿយៗត្រូវបានគេហៅថា "super-resolution") បង្កើនគុណភាពបង្ហាញរូបភាពដោយព្យាករណ៍ពីព័ត៌មានលម្អិតដែលមានគុណភាពបង្ហាញខ្ពស់ដែលបាត់ពីលំនាំដែលបានរៀនក្នុងអំឡុងពេលហ្វឹកហាត់។ ជំនួសឱ្យការលាតសន្ធឹងភីកសែលដូចជាការបញ្ចូល bicubic គំរូសិក្សាពីគែម វាយនភាព ផ្ទៃ និងបន្ទាត់ដូចអក្សរ បន្ទាប់មកបង្កើតទិន្នន័យភីកសែលថ្មីដែលស្របនឹងលំនាំដែលបានរៀនទាំងនោះ។ វាមិនសូវ "ស្តារការពិតឡើងវិញ" ទេ ប៉ុន្តែ "ធ្វើការស្មានដែលអាចទុកចិត្តបាន" ដែលអានថាធម្មជាតិ។.

ការបង្កើនទំហំ AI ធៀបនឹងការប្តូរទំហំ bicubic ឬបែបប្រពៃណី

វិធីសាស្ត្របង្កើនគុណភាពរូបភាពបែបប្រពៃណី (ដូចជា bicubic) ភាគច្រើនបញ្ចូលគ្នារវាងភីកសែលដែលមានស្រាប់ ដោយធ្វើឲ្យការផ្លាស់ប្តូររលូនដោយមិនបង្កើតព័ត៌មានលម្អិតថ្មីពិតប្រាកដ។ ការបង្កើនគុណភាពរូបភាពដោយ AI មានគោលបំណងកសាងរចនាសម្ព័ន្ធដែលអាចជឿទុកចិត្តឡើងវិញដោយការសម្គាល់សញ្ញាដែលមើលឃើញ និងព្យាករណ៍ពីអ្វីដែលកំណែដែលមានគុណភាពបង្ហាញខ្ពស់នៃសញ្ញាទាំងនោះមានទំនោរទៅជារូបរាង។ នោះហើយជាមូលហេតុដែលលទ្ធផល AI អាចមានអារម្មណ៍ច្បាស់ជាងមុន ហើយក៏ជាមូលហេតុដែលពួកគេអាចណែនាំវត្ថុបុរាណ ឬ "បង្កើត" ព័ត៌មានលម្អិតដែលមិនមាននៅក្នុងប្រភព។.

ហេតុអ្វីបានជាមុខអាចមើលទៅមានក្រមួន ឬរលោងពេក

មុខដែលមានសភាពដូចក្រមួនជាធម្មតាកើតចេញពីការកាត់បន្ថយសំឡេងរំខាន និងការធ្វើឱ្យរលោងយ៉ាងខ្លាំងក្លា រួមផ្សំជាមួយនឹងការធ្វើឱ្យច្បាស់ដែលលុបចេញនូវវាយនភាពស្បែកធម្មជាតិ។ ឧបករណ៍ជាច្រើនព្យាបាលសំឡេងរំខាន និងវាយនភាពល្អិតល្អន់ដូចគ្នា ដូច្នេះការ "សម្អាត" រូបភាពអាចលុបរន្ធញើស និងព័ត៌មានលម្អិតស្រទន់។ វិធីសាស្រ្តទូទៅមួយគឺកាត់បន្ថយការកាត់បន្ថយសំឡេងរំខាន និងការធ្វើឱ្យច្បាស់ ប្រើរបៀបថែរក្សាមុខប្រសិនបើមាន បន្ទាប់មកបញ្ចូលគ្រាប់ធញ្ញជាតិឡើងវិញដើម្បីឱ្យលទ្ធផលមើលទៅមិនសូវប្លាស្ទិក និងមានភាពទាក់ទាញជាងមុន។.

វត្ថុបុរាណបង្កើនទំហំ AI ទូទៅដែលត្រូវតាមដាន

ការបង្ហាញជាធម្មតារួមមានរាងហាឡូជុំវិញគែម លំនាំវាយនភាពដដែលៗ (ដូចជាឥដ្ឋចម្លង-បិទភ្ជាប់) ភាពផ្ទុយគ្នាតូចៗស្រួយៗ និងអក្សរដែលប្រែទៅជា "ស្ទើរតែជាអក្សរ"។ នៅក្នុងលំហូរការងារដែលផ្អែកលើការសាយភាយ អ្នកក៏អាចមើលឃើញការរសាត់នៃព័ត៌មានលម្អិតដែលលក្ខណៈពិសេសតូចៗផ្លាស់ប្តូរយ៉ាងស្ទាត់ជំនាញ។ សម្រាប់វីដេអូ ការភ្លឹបភ្លែតៗ និងព័ត៌មានលម្អិតវារឆ្លងកាត់ស៊ុមគឺជាសញ្ញាព្រមានធំៗ។ ប្រសិនបើវាមើលទៅល្អតែនៅពេលពង្រីកខ្លាំងពេក ការកំណត់ប្រហែលជាឈ្លានពានពេក។.

របៀបដែល GAN, CNN និង diffusion upscalers មានទំនោរខុសគ្នានៅក្នុងលទ្ធផល

គុណភាពបង្ហាញខ្ពស់ដែលមានមូលដ្ឋានលើ CNN មានទំនោរទៅរកភាពស្ថិតស្ថេរ និងអាចទស្សន៍ទាយបានច្រើនជាង ប៉ុន្តែវាអាចមើលទៅ "ដំណើរការ" ប្រសិនបើត្រូវបានជំរុញយ៉ាងខ្លាំង។ ជម្រើសដែលមានមូលដ្ឋានលើ GAN (រចនាប័ទ្ម ESRGAN) ជារឿយៗបង្កើតវាយនភាពដ៏មុតស្រួច និងភាពមុតស្រួចដែលយល់ឃើញ ប៉ុន្តែពួកវាអាចបំភាន់ព័ត៌មានលម្អិតមិនត្រឹមត្រូវ ជាពិសេសនៅលើផ្ទៃ។ ការបង្កើនមាត្រដ្ឋានដែលមានមូលដ្ឋានលើឌីហ្វ្លុយស៊ីសអាចបង្កើតព័ត៌មានលម្អិតដ៏ស្រស់ស្អាត និងសមហេតុផល ប៉ុន្តែវាអាចរសាត់ចេញពីរចនាសម្ព័ន្ធដើម ប្រសិនបើការកំណត់ការណែនាំ ឬកម្លាំងខ្លាំងពេក។.

យុទ្ធសាស្ត្រកំណត់ជាក់ស្តែងសម្រាប់ជៀសវាងរូបរាង "AI ពេក"

ចាប់ផ្តើមអភិរក្សនិយម៖ បង្កើនទំហំ 2× ឬ 4× មុនពេលឈានដល់កត្តាខ្លាំង។ ប្រសិនបើមុខមើលទៅដូចប្លាស្ទិក សូមបន្ថយសំឡេងរំខាន និងការធ្វើឱ្យច្បាស់ ហើយសាកល្បងរបៀបស្គាល់មុខ។ ប្រសិនបើវាយនភាពខ្លាំងពេក សូមបន្ថយការបង្កើនព័ត៌មានលម្អិត ហើយពិចារណាបន្ថែមគ្រាប់ធញ្ញជាតិបន្តិចបន្តួចបន្ទាប់ពីនោះ។ ប្រសិនបើគែមភ្លឺ សូមកាត់បន្ថយការធ្វើឱ្យច្បាស់ ហើយពិនិត្យមើលការបង្ក្រាបហាឡូ ឬវត្ថុបុរាណ។ នៅក្នុងបំពង់ជាច្រើន "តិច" ឈ្នះព្រោះវារក្សាភាពប្រាកដនិយមដែលអាចទុកចិត្តបាន។.

ការដោះស្រាយរូបភាពស្កេនចាស់ៗ ឬរូបភាពដែលបានបង្ហាប់ JPEG យ៉ាងច្រើនមុនពេលបង្កើនទំហំ

រូបភាពដែលបានបង្ហាប់គឺពិបាកណាស់ ពីព្រោះម៉ូដែលអាចចាត់ទុកវត្ថុបុរាណនៃប្លុកជាវាយនភាពពិត ហើយពង្រីកវា។ លំហូរការងារទូទៅមួយគឺការដកយកវត្ថុបុរាណចេញ ឬការបំបាត់ការរារាំងជាមុនសិន បន្ទាប់មកការបង្កើនទំហំ បន្ទាប់មកការធ្វើឱ្យច្បាស់ស្រាលៗ លុះត្រាតែចាំបាច់។ សម្រាប់ការស្កេន ការសម្អាតថ្នមៗអាចជួយម៉ូដែលផ្តោតលើរចនាសម្ព័ន្ធពិតប្រាកដជាជាងការខូចខាត។ គោលដៅគឺដើម្បីកាត់បន្ថយ "សញ្ញាវាយនភាពក្លែងក្លាយ" ដូច្នេះឧបករណ៍បង្កើនទំហំមិនត្រូវបានបង្ខំឱ្យធ្វើការស្មានដោយទំនុកចិត្តពីការបញ្ចូលសំឡេងរំខាននោះទេ។.

ហេតុអ្វីបានជាការបង្កើនគុណភាពវីដេអូពិបាកជាងការបង្កើនគុណភាពរូបថត

ការបង្កើនគុណភាពវីដេអូត្រូវតែស៊ីសង្វាក់គ្នានៅទូទាំងស៊ុម មិនមែនគ្រាន់តែល្អនៅលើរូបភាពមួយនោះទេ។ ប្រសិនបើព័ត៌មានលម្អិតភ្លឹបភ្លែតៗពីស៊ុមមួយទៅស៊ុមមួយ លទ្ធផលនឹងក្លាយទៅជារំខានយ៉ាងឆាប់រហ័ស។ វិធីសាស្រ្តផ្តោតលើវីដេអូប្រើព័ត៌មានបណ្ដោះអាសន្នពីស៊ុមជិតខាងដើម្បីធ្វើឱ្យការកសាងឡើងវិញមានស្ថេរភាព និងជៀសវាងវត្ថុបុរាណដែលភ្លឺចែងចាំង។ លំហូរការងារជាច្រើនក៏រួមបញ្ចូល denoise, deinterlacing សម្រាប់ប្រភពជាក់លាក់ និងការណែនាំឡើងវិញនូវគ្រាប់ធញ្ញជាតិជាជម្រើស ដូច្នេះលំដាប់ទាំងមូលមានអារម្មណ៍ស៊ីសង្វាក់គ្នាជាជាងភាពមុតស្រួចសិប្បនិម្មិត។.

នៅពេលដែលការបង្កើនប្រសិទ្ធភាព AI មិនសមរម្យ ឬមានហានិភ័យក្នុងការពឹងផ្អែក

ការបង្កើនប្រសិទ្ធភាព AI ត្រូវបានចាត់ទុកថាជាការបង្កើនប្រសិទ្ធភាព មិនមែនជាភស្តុតាងទេ។ នៅក្នុងបរិបទដែលមានហានិភ័យខ្ពស់ដូចជា សារព័ត៌មាន ភស្តុតាងផ្លូវច្បាប់ រូបភាពវេជ្ជសាស្ត្រ ឬការងារកោសល្យវិច្ច័យ ការបង្កើតភីកសែល "គួរឱ្យជឿជាក់" អាចនាំឱ្យយល់ច្រឡំ ព្រោះវាអាចបន្ថែមព័ត៌មានលម្អិតដែលមិនត្រូវបានចាប់យក។ ការកំណត់ដែលមានសុវត្ថិភាពជាងគឺការប្រើប្រាស់វាដោយបង្ហាញជាឧទាហរណ៍ និងបង្ហាញថាដំណើរការ AI បានបង្កើតព័ត៌មានលម្អិតឡើងវិញ។ ប្រសិនបើភាពស្មោះត្រង់គឺមានសារៈសំខាន់ សូមរក្សាឯកសារដើម និងកត់ត្រាជំហានដំណើរការ និងការកំណត់នីមួយៗ។.

ឯកសារយោង

arXiv - ការរៀនសូត្រស៊ីជម្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ - arxiv.org
arXiv - រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ដោយប្រើបណ្តាញ Deep Convolutional (SRCNN) - arxiv.org
arXiv - Real-ESRGAN - arxiv.org
arXiv - ESRGAN - arxiv.org
arXiv - SR3 - arxiv.org
អ្នកអភិវឌ្ឍន៍ NVIDIA - NVIDIA DLSS - developer.nvidia.com
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
ការចូលប្រើប្រាស់ដោយសេរីរបស់មូលនិធិចក្ខុវិស័យកុំព្យូទ័រ (CVF) - BasicVSR៖ ការស្វែងរកសមាសធាតុសំខាន់ៗនៅក្នុងវីដេអូដែលមានគុណភាពបង្ហាញខ្ពស់ (CVPR 2021) - openaccess.thecvf.com
arXiv - បណ្តាញប្រឆាំងបង្កើត - arxiv.org
arXiv - SRGAN - arxiv.org
arXiv - ការបាត់បង់ការយល់ឃើញ (Johnson et al., 2016) - arxiv.org
GitHub - ឃ្លាំង Real-ESRGAN (ជម្រើសក្រឡាក្បឿង) - github.com
វិគីភីឌា - ការបញ្ចូលប៊ីគុប៊ីក - wikipedia.org
មន្ទីរពិសោធន៍ Topaz - រូបថត Topaz - topazlabs.com
មន្ទីរពិសោធន៍ Topaz - វីដេអូ Topaz - topazlabs.com
មជ្ឈមណ្ឌលជំនួយ Adobe - Adobe Enhance > គុណភាពបង្ហាញខ្ពស់ - helpx.adobe.com
NIST / OSAC - មគ្គុទ្ទេសក៍ស្តង់ដារសម្រាប់ការគ្រប់គ្រងរូបភាពឌីជីថលកោសល្យវិច្ច័យ (កំណែ 1.0) - nist.gov
SWGDE - គោលការណ៍ណែនាំសម្រាប់ការវិភាគរូបភាពកោសល្យវិច្ច័យ - swgde.org

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ

សំណួរដែលសួរញឹកញាប់បន្ថែម

តើការបង្កើនទំហំ AI ខុសពីវិធីសាស្ត្រប្តូរទំហំបែបប្រពៃណីយ៉ាងដូចម្តេច?

ការបង្កើនគុណភាពបង្ហាញដោយ AI ព្យាករណ៍ពីព័ត៌មានលម្អិតដែលមានគុណភាពបង្ហាញខ្ពស់ដែលបាត់ពីលំនាំដែលមានស្រាប់នៅក្នុងរូបភាព ជាជាងគ្រាន់តែលាតសន្ធឹងភីកសែលដូចវិធីសាស្ត្រប្រពៃណីដូចជា bicubic interpolation ធ្វើ។ នេះនាំឱ្យរូបភាពកាន់តែច្បាស់ និងលម្អិតជាងមុន។.
តើអ្វីទៅជាវត្ថុបុរាណទូទៅដែលខ្ញុំគួរតាមដាននៅពេលប្រើការបង្កើនទំហំដោយ AI?

វត្ថុបុរាណទូទៅរួមមាន ហាឡូជុំវិញគែម លំនាំវាយនភាពដដែលៗ ផ្ទៃរលោងពេក ឬមានក្រមួន និងអក្សរដែលប្រែក្លាយទៅជា 'ស្ទើរតែអក្សរ'។ វាជារឿងសំខាន់ក្នុងការតាមដានបញ្ហាទាំងនេះ ដើម្បីធានាបាននូវលទ្ធផលដែលមើលទៅធម្មជាតិ។.
ហេតុអ្វីបានជាមុខពេលខ្លះមើលទៅរលោងពេក ឬមិនប្រាកដនិយមពេកបន្ទាប់ពីការបង្កើនទំហំ?

មុខអាចមើលទៅរលោងពេកដោយសារតែការបំបាត់សំឡេងរំខាន និងការធ្វើឱ្យច្បាស់ខ្លាំង ដែលអាចលុបចេញនូវវាយនភាពដូចជារន្ធញើស។ ដើម្បីទទួលបានរូបរាងធម្មជាតិជាងមុន សូមពិចារណាកាត់បន្ថយការបន្ថយសំឡេងរំខាន និងការធ្វើឱ្យច្បាស់។.
តើខ្ញុំគួរធ្វើដូចម្តេចប្រសិនបើរូបភាពរបស់ខ្ញុំមើលទៅស្រួយៗ ឬមានសំឡេងរំខានច្រើនពេកបន្ទាប់ពីប្រើ AI upscaling?

ប្រសិនបើរូបភាពរបស់អ្នកមើលទៅស្រួយៗ សូមសាកល្បងកែតម្រូវគ្រាប់រំកិល denoise និង detail enhancement។ ការបន្ថែមគ្រាប់តូចៗក៏អាចជួយស្តារអារម្មណ៍ថតរូបឡើងវិញបានដែរ។.
តើគំរូ GAN និង CNN ប្រៀបធៀបគ្នាយ៉ាងដូចម្តេចក្នុងលទ្ធផលនៃការបង្កើនសមត្ថភាព AI?

ម៉ូដែល CNN ជាទូទៅមានស្ថេរភាព និងអាចព្យាករណ៍បាន ខណៈពេលដែលម៉ូដែល GAN ជារឿយៗផ្តល់នូវព័ត៌មានលម្អិតច្បាស់ជាង ប៉ុន្តែប្រឈមនឹងការដាក់បញ្ចូលធាតុមិនប្រាកដនិយម។ ការជ្រើសរើសរវាងពួកវាអាស្រ័យលើតម្រូវការរបស់អ្នកសម្រាប់ភាពប្រាកដនិយម ធៀបនឹងវាយនភាពប្រសើរឡើង។.
តើការបង្កើនគុណភាពរូបភាពដោយ AI សមស្របសម្រាប់ខ្លឹមសារវីដេអូដែរឬទេ ហើយតើវាបង្ហាញពីបញ្ហាប្រឈមអ្វីខ្លះ?

មែនហើយ ការបង្កើនគុណភាពរូបភាពដោយ AI គឺសមរម្យសម្រាប់វីដេអូ ប៉ុន្តែវាអាចជាបញ្ហាប្រឈមមួយ ពីព្រោះភាពស៊ីសង្វាក់គ្នានៅទូទាំងស៊ុមគឺមានសារៈសំខាន់ណាស់។ ព័ត៌មានលម្អិតភ្លឹបភ្លែតៗ ឬភ្លឺរលោងអាចរំខានអ្នកមើល ដូច្នេះវិធីសាស្ត្រឯកទេសដែលផ្តោតលើវីដេអូត្រូវបានណែនាំ។.
តើពេលណាដែលវាមិនសមរម្យក្នុងការពឹងផ្អែកលើការបង្កើនប្រសិទ្ធភាព AI?

ការបង្កើនប្រសិទ្ធភាព AI គួរតែត្រូវបានប្រើប្រាស់ដោយប្រុងប្រយ័ត្ននៅក្នុងសេណារីយ៉ូដែលមានហានិភ័យខ្ពស់ ដូចជាសារព័ត៌មាន ឬការវិភាគកោសល្យវិច្ច័យ ដែលភាពត្រឹមត្រូវមានសារៈសំខាន់។ វាត្រូវបានចាត់ទុកថាជាការបង្កើនប្រសិទ្ធភាពជាជាងភស្តុតាងច្បាស់លាស់ ហើយតម្លាភាពអំពីដំណើរការ AI គឺមានសារៈសំខាន់។.
តើខ្ញុំគួរចងចាំអ្វីខ្លះនៅពេលបង្កើនទំហំរូបភាពដែលបានបង្ហាប់ខ្លាំង?

សម្រាប់រូបភាពដែលត្រូវបានបង្ហាប់ខ្លាំង សូមចាប់ផ្តើមជាមួយនឹងការដកយកវត្ថុបុរាណចេញ ដើម្បីកាត់បន្ថយការស្ទះដែលមិនចង់បាន។ បន្ទាប់ពីនោះ អ្នកអាចបង្កើនទំហំ និងអនុវត្តការធ្វើឱ្យច្បាស់ដោយពន្លឺ ប្រសិនបើចាំបាច់ ដើម្បីរក្សាព័ត៌មានលម្អិតដោយមិនចាំបាច់ពង្រីកវត្ថុបុរាណដែលបានបង្ហាប់។.

របៀបដែល AI Upscaling ដំណើរការ៖ គំនិតស្នូល នៅក្នុងពាក្យប្រចាំថ្ងៃ 🧩

តើ​អ្វី​ទៅ​ដែល​ធ្វើ​ឱ្យ​ការ​បង្កើន​ទំហំ​ដោយ​ AI មាន​លក្ខណៈ​ល្អ? ✅🛠️

តារាងប្រៀបធៀប៖ ជម្រើសបង្កើនប្រសិទ្ធភាព AI ដ៏ពេញនិយម (និងអ្វីដែលវាល្អសម្រាប់) 📊🙂

អាថ៌កំបាំងដ៏ធំ៖ តារាម៉ូដែលរៀនគូសផែនទីពីគុណភាពបង្ហាញទាបទៅគុណភាពបង្ហាញខ្ពស់ 🧠➡️🖼️

ចំណុចសំខាន់ៗ៖ អ្វីដែលកើតឡើងក្នុងអំឡុងពេលសន្និដ្ឋាន (នៅពេលអ្នកធ្វើឱ្យប្រសើរឡើង) ⚙️✨

គ្រួសារគំរូសំខាន់ៗដែលប្រើសម្រាប់ការបង្កើនប្រសិទ្ធភាព AI (និងមូលហេតុដែលពួកគេមានអារម្មណ៍ខុសគ្នា) 🤖📚

១) គុណភាពបង្ហាញខ្ពស់ដែលមានមូលដ្ឋានលើ CNN (ជាឧបករណ៍បុរាណ)

2) ការបង្កើនគុណភាពរូបភាពដោយផ្អែកលើ GAN (រចនាប័ទ្ម ESRGAN) 🎭

៣) ការបង្កើនទំហំដោយផ្អែកលើការសាយភាយ (តួអក្សរជំនួសច្នៃប្រឌិត) 🌫️➡️🖼️

៤) ការបង្កើនគុណភាពវីដេអូជាមួយនឹងភាពស៊ីសង្វាក់គ្នាតាមពេលវេលា 🎞️

ហេតុអ្វីបានជាការបង្កើនប្រសិទ្ធភាព AI ពេលខ្លះមើលទៅដូចជាក្លែងក្លាយ (និងរបៀបសម្គាល់វា) 👀🚩

របៀបដែល AI Upscaling ដំណើរការ៖ ផ្នែកបណ្តុះបណ្តាល ដោយមិនមានបញ្ហាគណិតវិទ្យា 📉🙂

លំហូរការងារជាក់ស្តែង៖ រូបថត ស្កែនចាស់ៗ អានីមេ និងវីដេអូ 📸🧾🎥

រូបថត (រូបបញ្ឈរ ទេសភាព រូបថតផលិតផល)

ការស្កេនចាស់ៗ និងរូបភាពដែលបានបង្ហាប់យ៉ាងខ្លាំង

អានីមេ និង សិល្បៈបន្ទាត់

វីដេអូ

ការជ្រើសរើសការកំណត់ដោយមិនចាំបាច់ទាយច្រើនពេក (សន្លឹកបន្លំតូចមួយ) 🎛️😵💫

សីលធម៌ ភាពត្រឹមត្រូវ និងសំណួរឆ្គងៗអំពី «សច្ចភាព» 🧭😬

កំណត់ចំណាំបិទបញ្ចប់ និងការសង្ខេបរហ័ស 🧡✅

ឧទាហរណ៍ជាក់ស្តែង៖ ការបង្កើនទំហំរូបថតផលិតផលទីផ្សារចាស់ 📸

សេណារីយ៉ូ

អ្វីដែលដំណើរការការងារត្រូវការ

ឧទាហរណ៍នៃការណែនាំ

របៀបសាកល្បងវា

លទ្ធផល

អ្វីដែលអាចខុសបាន

សម្ភារៈសិក្សាជាក់ស្តែង

ឧទាហរណ៍​ក្នុង​ពិភព​ពិត៖ ការ​បង្កើន​ទំហំ​វីដេអូ​ហ្វឹកហាត់​ចាស់​ដោយ​មិន​ធ្វើ​ឱ្យ​វា​ភ្លឺ​ចែងចាំង

សេណារីយ៉ូ

អ្វីដែលដំណើរការការងារត្រូវការ

ឧទាហរណ៍នៃការណែនាំ

របៀបសាកល្បងវា

លទ្ធផល

អ្វីដែលអាចខុសបាន

សម្ភារៈសិក្សាជាក់ស្តែង

សំណួរដែលសួរញឹកញាប់

ការបង្កើនប្រសិទ្ធភាព AI និងរបៀបដែលវាដំណើរការ

ការបង្កើនទំហំ AI ធៀបនឹងការប្តូរទំហំ bicubic ឬបែបប្រពៃណី

ហេតុអ្វីបានជាមុខអាចមើលទៅមានក្រមួន ឬរលោងពេក

វត្ថុបុរាណ​បង្កើន​ទំហំ​ AI ទូទៅ​ដែល​ត្រូវ​តាមដាន

របៀបដែល GAN, CNN និង diffusion upscalers មានទំនោរខុសគ្នានៅក្នុងលទ្ធផល

យុទ្ធសាស្ត្រកំណត់ជាក់ស្តែងសម្រាប់ជៀសវាងរូបរាង "AI ពេក"

ការដោះស្រាយរូបភាពស្កេនចាស់ៗ ឬរូបភាពដែលបានបង្ហាប់ JPEG យ៉ាងច្រើនមុនពេលបង្កើនទំហំ

ហេតុអ្វីបានជាការបង្កើនគុណភាពវីដេអូពិបាកជាងការបង្កើនគុណភាពរូបថត

នៅពេលដែលការបង្កើនប្រសិទ្ធភាព AI មិនសមរម្យ ឬមានហានិភ័យក្នុងការពឹងផ្អែក

ឯកសារយោង

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

សំណួរដែលសួរញឹកញាប់បន្ថែម

តើការបង្កើនទំហំ AI ខុសពីវិធីសាស្ត្រប្តូរទំហំបែបប្រពៃណីយ៉ាងដូចម្តេច?

តើ​អ្វី​ទៅ​ជា​វត្ថុបុរាណ​ទូទៅ​ដែល​ខ្ញុំ​គួរ​តាមដាន​នៅពេល​ប្រើ​ការ​បង្កើន​ទំហំ​ដោយ AI?

ហេតុអ្វីបានជាមុខពេលខ្លះមើលទៅរលោងពេក ឬមិនប្រាកដនិយមពេកបន្ទាប់ពីការបង្កើនទំហំ?

តើខ្ញុំគួរធ្វើដូចម្តេចប្រសិនបើរូបភាពរបស់ខ្ញុំមើលទៅស្រួយៗ ឬមានសំឡេងរំខានច្រើនពេកបន្ទាប់ពីប្រើ AI upscaling?

តើ​គំរូ GAN និង CNN ប្រៀបធៀប​គ្នា​យ៉ាង​ដូចម្តេច​ក្នុង​លទ្ធផល​នៃ​ការ​បង្កើន​សមត្ថភាព AI?

តើការបង្កើនគុណភាពរូបភាពដោយ AI សមស្របសម្រាប់ខ្លឹមសារវីដេអូដែរឬទេ ហើយតើវាបង្ហាញពីបញ្ហាប្រឈមអ្វីខ្លះ?

តើពេលណាដែលវាមិនសមរម្យក្នុងការពឹងផ្អែកលើការបង្កើនប្រសិទ្ធភាព AI?

តើខ្ញុំគួរចងចាំអ្វីខ្លះនៅពេលបង្កើនទំហំរូបភាពដែលបានបង្ហាប់ខ្លាំង?

តើអ្វីទៅដែលធ្វើឱ្យការបង្កើនទំហំដោយ AI មានលក្ខណៈល្អ? ✅🛠️

ឧទាហរណ៍ក្នុងពិភពពិត៖ ការបង្កើនទំហំវីដេអូហ្វឹកហាត់ចាស់ដោយមិនធ្វើឱ្យវាភ្លឺចែងចាំង

វត្ថុបុរាណបង្កើនទំហំ AI ទូទៅដែលត្រូវតាមដាន

តើអ្វីទៅជាវត្ថុបុរាណទូទៅដែលខ្ញុំគួរតាមដាននៅពេលប្រើការបង្កើនទំហំដោយ AI?

តើគំរូ GAN និង CNN ប្រៀបធៀបគ្នាយ៉ាងដូចម្តេចក្នុងលទ្ធផលនៃការបង្កើនសមត្ថភាព AI?