ចម្លើយខ្លី៖ ការបង្កើនគុណភាពបង្ហាញដោយ AI ដំណើរការដោយការហ្វឹកហាត់គំរូលើរូបភាពដែលមានគុណភាពបង្ហាញទាប និងខ្ពស់ដែលបានផ្គូផ្គង បន្ទាប់មកប្រើវាដើម្បីទស្សន៍ទាយភីកសែលបន្ថែមដែលអាចទុកចិត្តបានក្នុងអំឡុងពេលបង្កើនគុណភាពបង្ហាញ។ ប្រសិនបើគំរូបានឃើញវាយនភាព ឬមុខស្រដៀងគ្នានៅក្នុងការហ្វឹកហាត់ វាអាចបន្ថែមព័ត៌មានលម្អិតដែលគួរឱ្យជឿជាក់។ បើមិនដូច្នោះទេ វាអាច "បំភាន់" វត្ថុបុរាណដូចជាហាឡូ ស្បែកដូចក្រមួន ឬភ្លឹបភ្លែតៗនៅក្នុងវីដេអូ។
ចំណុចសំខាន់ៗ៖
ការព្យាករណ៍ ៖ គំរូនេះបង្កើតព័ត៌មានលម្អិតដែលអាចទុកចិត្តបាន មិនមែនជាការកសាងឡើងវិញនូវការពិតដែលធានានោះទេ។
ជម្រើសម៉ូដែល ៖ CNN មានទំនោរមានស្ថេរភាពជាង; GAN អាចមើលទៅច្បាស់ជាង ប៉ុន្តែមានហានិភ័យក្នុងការបង្កើតលក្ខណៈពិសេស។
ការត្រួតពិនិត្យវត្ថុបុរាណ ៖ ប្រយ័ត្នចំពោះហាឡូ វាយនភាពដដែលៗ "ស្ទើរតែជាអក្សរ" និងមុខប្លាស្ទិក។
ស្ថេរភាពវីដេអូ ៖ ប្រើវិធីសាស្ត្រតាមពេលវេលា បើមិនដូច្នោះទេ អ្នកនឹងឃើញពន្លឺភ្លឹបភ្លែតៗ និងរសាត់ពីស៊ុមមួយទៅស៊ុមមួយ។
ការប្រើប្រាស់ដែលមានហានិភ័យខ្ពស់ ៖ ប្រសិនបើភាពត្រឹមត្រូវមានសារៈសំខាន់ សូមបង្ហាញអំពីដំណើរការ និងចាត់ទុកលទ្ធផលជាឧទាហរណ៍។

អ្នកប្រហែលជាធ្លាប់បានឃើញវាហើយ៖ រូបភាពតូចមួយដែលស្រួយៗប្រែទៅជាអ្វីមួយដែលស្រួយៗគ្រប់គ្រាន់ដើម្បីបោះពុម្ព ផ្សាយ ឬទម្លាក់ចូលទៅក្នុងបទបង្ហាញដោយមិនញញើត។ វាមានអារម្មណ៍ដូចជាការបន្លំ។ ហើយ - តាមរបៀបដ៏ល្អបំផុត - វាពិតជាដូច្នោះមែន 😅
ដូច្នេះ របៀបដែល AI Upscaling ដំណើរការ គឺអាស្រ័យទៅលើអ្វីមួយដែលជាក់លាក់ជាង “កុំព្យូទ័របង្កើនព័ត៌មានលម្អិត” (រលកដៃ) និងកាន់តែខិតជិត “គំរូមួយព្យាករណ៍រចនាសម្ព័ន្ធដែលមានគុណភាពបង្ហាញខ្ពស់ដែលអាចទុកចិត្តបានដោយផ្អែកលើគំរូដែលវាបានរៀនពីឧទាហរណ៍ជាច្រើន” ( ការរៀនសូត្រជ្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ )។ ជំហានព្យាករណ៍នោះគឺជាហ្គេមទាំងមូល - ហើយវាជាមូលហេតុដែល AI Upscaling អាចមើលទៅគួរឱ្យភ្ញាក់ផ្អើល… ឬប្លាស្ទិកបន្តិច… ឬដូចជាឆ្មារបស់អ្នកដុះពុកមាត់បន្ថែម។
អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖
🔗 របៀបដែល AI ដំណើរការ
រៀនមូលដ្ឋានគ្រឹះនៃគំរូ ទិន្នន័យ និងការសន្និដ្ឋាននៅក្នុង AI។.
🔗 របៀបដែល AI រៀន
មើលពីរបៀបដែលទិន្នន័យបណ្តុះបណ្តាល និងមតិកែលម្អធ្វើអោយប្រសើរឡើងនូវដំណើរការគំរូតាមពេលវេលា។.
🔗 របៀបដែល AI រកឃើញភាពមិនប្រក្រតី
យល់ពីលំនាំមូលដ្ឋាន និងរបៀបដែល AI សម្គាល់ឥរិយាបថមិនប្រក្រតីយ៉ាងរហ័ស។.
🔗 របៀបដែល AI ព្យាករណ៍និន្នាការ
ស្វែងយល់ពីវិធីសាស្ត្រព្យាករណ៍ដែលសម្គាល់សញ្ញា និងព្យាករណ៍ពីតម្រូវការនាពេលអនាគត។.
របៀបដែល AI Upscaling ដំណើរការ៖ គំនិតស្នូល នៅក្នុងពាក្យប្រចាំថ្ងៃ 🧩
ការបង្កើនគុណភាពបង្ហាញមានន័យថាការបង្កើនគុណភាពបង្ហាញ៖ ភីកសែលកាន់តែច្រើន រូបភាពធំជាង។ ការបង្កើនគុណភាពបង្ហាញបែបប្រពៃណី (ដូចជា bicubic) ជាទូទៅលាតសន្ធឹងភីកសែល និងធ្វើឱ្យការផ្លាស់ប្តូររលូន ( ការបញ្ចូលចន្លោះ Bicubic )។ វាល្អ ប៉ុន្តែវាមិនអាចបង្កើត ថ្មី - វាគ្រាន់តែបញ្ចូលចន្លោះប៉ុណ្ណោះ។
ការបង្កើនគុណភាពរូបភាពដោយ AI សាកល្បងអ្វីដែលដិតជាងនេះ (ហៅថា "គុណភាពបង្ហាញខ្ពស់" នៅក្នុងពិភពស្រាវជ្រាវ) ( ការរៀនសូត្រយ៉ាងស៊ីជម្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ )៖
-
វាពិនិត្យមើលការបញ្ចូលដែលមានគុណភាពបង្ហាញទាប
-
ស្គាល់លំនាំ (គែម វាយនភាព លក្ខណៈពិសេសលើផ្ទៃមុខ ស្នាមអក្សរ ការត្បាញក្រណាត់...)
-
រូបរាង របស់កំណែដែលមានគុណភាពបង្ហាញ ខ្ពស់
-
បង្កើតទិន្នន័យភីកសែលបន្ថែមដែលសមនឹងលំនាំទាំងនោះ
មិនមែន «ស្តារការពិតឡើងវិញយ៉ាងល្អឥតខ្ចោះ» ទេ ដូចជា «ធ្វើការស្មានដែលអាចទុកចិត្តបានខ្ពស់» ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) )។ ប្រសិនបើវាស្តាប់ទៅគួរឱ្យសង្ស័យបន្តិច អ្នកមិនខុសទេ - ប៉ុន្តែវាក៏ជាមូលហេតុដែលវាដំណើរការបានល្អដែរ 😄
ហើយមែនហើយ នេះមានន័យថា ការបង្កើនគុណភាពរូបភាពដោយ AI ជាទូទៅគឺជាការគ្រប់គ្រងការយល់ច្រឡំ… ប៉ុន្តែតាមរបៀបដែលមានផលិតភាព និងគោរពភីកសែល។.
តើអ្វីទៅដែលធ្វើឱ្យការបង្កើនទំហំដោយ AI មានលក្ខណៈល្អ? ✅🛠️
ប្រសិនបើអ្នកកំពុងវិនិច្ឆ័យឧបករណ៍បង្កើនប្រសិទ្ធភាព AI (ឬការកំណត់ជាមុន) នេះជាអ្វីដែលទំនងជាសំខាន់បំផុត៖
-
ការស្ដារឡើងវិញនូវព័ត៌មានលម្អិតដោយមិនចាំបាច់ចម្អិនច្រើនពេក
ការបង្កើនគុណភាពល្អបន្ថែមភាពក្រៀម និងរចនាសម្ព័ន្ធ មិនមែនជាសំឡេងក្រៀម ឬរន្ធញើសក្លែងក្លាយនោះទេ។ -
វិន័យគែម
បន្ទាត់ស្អាតនៅតែស្អាត។ ម៉ូដែលមិនល្អធ្វើឱ្យគែមរង្គើ ឬដុះចេញជារាងហាឡូ។ -
ភាពប្រាកដនិយមនៃវាយនភាព
សក់មិនគួរក្លាយជាស្នាមជក់លាបពណ៌ទេ។ ឥដ្ឋមិនគួរក្លាយជាត្រាលំនាំដដែលៗទេ។ -
ការដោះស្រាយសំឡេងរំខាន និងការបង្ហាប់
រូបភាពប្រចាំថ្ងៃជាច្រើនត្រូវបានបំលែងជា JPEG រហូតដល់ខូច។ ឧបករណ៍បង្កើនគុណភាពរូបភាពល្អមិនបង្កើនការខូចខាតនោះទេ ( Real-ESRGAN )។ -
ការយល់ដឹងអំពីមុខ និងអក្សរ មុខ
និងអក្សរគឺជាកន្លែងដែលងាយស្រួលបំផុតក្នុងការរកឃើញកំហុស។ គំរូល្អៗប្រព្រឹត្តចំពោះពួកគេដោយថ្នមៗ (ឬមានរបៀបពិសេស)។ -
ភាពស៊ីសង្វាក់គ្នានៅទូទាំងស៊ុម (សម្រាប់វីដេអូ)
ប្រសិនបើព័ត៌មានលម្អិតភ្លឹបភ្លែតៗពីស៊ុមមួយទៅស៊ុមមួយ ភ្នែករបស់អ្នកនឹងស្រែក។ ការបង្កើនទំហំវីដេអូរស់ ឬស្លាប់ដោយសារស្ថេរភាពបណ្ដោះអាសន្ន ( BasicVSR (CVPR 2021) )។ -
ការគ្រប់គ្រងដែលសមហេតុផល
អ្នកចង់បានគ្រាប់រំកិលដែលផ្គូផ្គងទៅនឹងលទ្ធផលពិតប្រាកដ៖ ការលុបបំបាត់សំលេងរំខាន ការបំបាត់ភាពមិនច្បាស់ ការដកយកវត្ថុបុរាណ ការរក្សាគ្រាប់ធញ្ញជាតិ ការធ្វើឱ្យច្បាស់... របស់របរជាក់ស្តែង។
ច្បាប់ស្ងប់ស្ងាត់មួយដែលនៅតែត្រូវអនុវត្ត៖ ការបង្កើនគុណភាពរូបភាព "ល្អបំផុត" ជារឿយៗគឺជាអ្វីដែលអ្នកស្ទើរតែមិនកត់សម្គាល់។ វាមើលទៅដូចជាអ្នកមានកាមេរ៉ាល្អជាងតាំងពីដំបូង 📷✨
តារាងប្រៀបធៀប៖ ជម្រើសបង្កើនប្រសិទ្ធភាព AI ដ៏ពេញនិយម (និងអ្វីដែលវាល្អសម្រាប់) 📊🙂
ខាងក្រោមនេះជាការប្រៀបធៀបជាក់ស្តែង។ តម្លៃមានភាពមិនច្បាស់លាស់ដោយចេតនា ពីព្រោះឧបករណ៍ប្រែប្រួលទៅតាមអាជ្ញាប័ណ្ណ កញ្ចប់ តម្លៃកុំព្យូទ័រ និងរបស់របរសប្បាយៗទាំងអស់។.
| ឧបករណ៍ / វិធីសាស្រ្ត | ល្អបំផុតសម្រាប់ | អារម្មណ៍តម្លៃ | ហេតុអ្វីបានជាវាដំណើរការ (ប្រហែល) |
|---|---|---|---|
| ឧបករណ៍បង្កើនគុណភាពរូបភាពលើតុបែប Topaz ( រូបថត Topaz , វីដេអូ Topaz ) | រូបថត វីដេអូ លំហូរការងារងាយស្រួល | បង់ប្រាក់បែប | ម៉ូដែលទូទៅដ៏រឹងមាំ + ការលៃតម្រូវច្រើន មានទំនោរ "គ្រាន់តែដំណើរការ" ... ភាគច្រើន |
| លក្ខណៈពិសេសប្រភេទ "Super Resolution" របស់ Adobe ( Adobe Enhance > Super Resolution ) | អ្នកថតរូបរួចហើយនៅក្នុងប្រព័ន្ធអេកូឡូស៊ីនោះ | ការជាវ-y | ការកសាងឡើងវិញនូវព័ត៌មានលម្អិតរឹងមាំ ជាធម្មតាមានលក្ខណៈអភិរក្សនិយម (មិនសូវមានភាពទាក់ទាញ) |
| វ៉ារ្យ៉ង់ Real-ESRGAN / ESRGAN ( Real-ESRGAN , ESRGAN ) | ការងារ DIY, អ្នកអភិវឌ្ឍន៍, ការងារជាបាច់ | ឥតគិតថ្លៃ (ប៉ុន្តែចំណាយពេលវេលា) | ពូកែខាងវាយនភាពលម្អិត អាចហឹរលើមុខប្រសិនបើអ្នកមិនប្រយ័ត្ន |
| របៀបបង្កើនគុណភាពសំឡេងដោយផ្អែកលើការសាយភាយ ( SR3 ) | ការងារច្នៃប្រឌិត លទ្ធផលដែលមានរចនាប័ទ្ម | លាយ | អាចបង្កើតព័ត៌មានលម្អិតដ៏ស្រស់ស្អាត - ក៏អាចបង្កើតរឿងមិនសមហេតុផលផងដែរ ដូច្នេះ... មែនហើយ |
| ឧបករណ៍បង្កើនគុណភាពហ្គេម (រចនាប័ទ្ម DLSS/FSR) ( Nvidia DLSS , AMD FSR 2 ) | ការលេងហ្គេម និងការបង្ហាញរូបភាពតាមពេលវេលាជាក់ស្តែង | កញ្ចប់ | ប្រើប្រាស់ទិន្នន័យចលនា និងអាទិភាពដែលបានរៀន - ឈ្នះលើដំណើរការរលូន 🕹️ |
| សេវាកម្មបង្កើនទំហំ Cloud | ភាពងាយស្រួល ជ័យជម្នះរហ័ស | បង់ប្រាក់សម្រាប់ការប្រើប្រាស់ម្តង | លឿន + អាចធ្វើមាត្រដ្ឋានបាន ប៉ុន្តែអ្នកអាចធ្វើពាណិជ្ជកម្មលើការគ្រប់គ្រង និងពេលខ្លះមានភាពប៉ិនប្រសប់ |
| កម្មវិធីបង្កើនគុណភាពរូបភាពដោយ AI ដែលផ្តោតលើវីដេអូ ( BasicVSR , Topaz Video ) | វីដេអូចាស់ៗ, អានីមេ, បណ្ណសារ | បង់ប្រាក់បែប | ល្បិចពេលវេលាដើម្បីកាត់បន្ថយការភ្លឹបភ្លែតៗ + ម៉ូដែលវីដេអូឯកទេស |
| ការបង្កើនគុណភាពរូបភាព/រូបភាពតាមទូរស័ព្ទឆ្លាតវៃ | ការប្រើប្រាស់ធម្មតា | រួមបញ្ចូល | ម៉ូដែលទម្ងន់ស្រាលត្រូវបានកែសម្រួលសម្រាប់ទិន្នផលដ៏ពេញចិត្ត មិនមែនភាពល្អឥតខ្ចោះទេ (នៅតែងាយស្រួលប្រើ) |
ការសារភាពអំពីការធ្វើទ្រង់ទ្រាយ quirk៖ “Paid-ish” កំពុងធ្វើការងារច្រើននៅក្នុងតារាងនោះ។ ប៉ុន្តែអ្នកយល់ពីគំនិតហើយ 😅
អាថ៌កំបាំងដ៏ធំ៖ តារាម៉ូដែលរៀនគូសផែនទីពីគុណភាពបង្ហាញទាបទៅគុណភាពបង្ហាញខ្ពស់ 🧠➡️🖼️
នៅក្នុងចំណុចស្នូលនៃការបង្កើនគុណភាពរូបភាពដោយប្រើបច្ចេកវិទ្យា AI ភាគច្រើនគឺការរៀបចំការរៀនដែលមានការត្រួតពិនិត្យ ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) )៖
-
ចាប់ផ្តើមជាមួយរូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ ("ការពិត")
-
បន្ថយពួកវាទៅជាកំណែដែលមានគុណភាពបង្ហាញទាប ("ការបញ្ចូល")
-
ហ្វឹកហាត់គំរូមួយដើម្បីកសាងឡើងវិញនូវគុណភាពបង្ហាញខ្ពស់ដើមពីគុណភាពបង្ហាញទាប
យូរៗទៅ គំរូនេះរៀនពីទំនាក់ទំនងដូចជា៖
-
«ភាពព្រិលៗបែបនេះនៅជុំវិញភ្នែកជាធម្មតាជាកម្មសិទ្ធិរបស់រោមភ្នែក»
-
"ចង្កោមភីកសែលនេះច្រើនតែបង្ហាញអក្សរ serif"
-
«ជម្រាលគែមនេះមើលទៅដូចជាខ្សែដំបូល មិនមែនជាសំឡេងរំខានចៃដន្យទេ»
វាមិនមែនជាការទន្ទេញចាំរូបភាពជាក់លាក់ណាមួយទេ (ក្នុងន័យសាមញ្ញ) វាកំពុងរៀនរចនាសម្ព័ន្ធស្ថិតិ ( ការរៀនសូត្រស៊ីជម្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ )។ សូមគិតថាវាដូចជាការរៀនវេយ្យាករណ៍នៃវាយនភាព និងគែម។ មិនមែនជាវេយ្យាករណ៍កំណាព្យទេ ដូចជា… វេយ្យាករណ៍សៀវភៅណែនាំ IKEA 🪑📦 (ពាក្យប្រៀបធៀបមិនសមហេតុផល ប៉ុន្តែជិតគ្រប់គ្រាន់)។
ចំណុចសំខាន់ៗ៖ អ្វីដែលកើតឡើងក្នុងអំឡុងពេលសន្និដ្ឋាន (នៅពេលអ្នកធ្វើឱ្យប្រសើរឡើង) ⚙️✨
នៅពេលអ្នកបញ្ចូលរូបភាពទៅក្នុង AI upscaler ជាធម្មតាមាន pipeline ដូចនេះ៖
-
ការកែច្នៃជាមុន
-
បម្លែងចន្លោះពណ៌ (ពេលខ្លះ)
-
ធ្វើឱ្យតម្លៃភីកសែលមានលក្ខណៈធម្មតា
-
តម្រៀបរូបភាពជាបំណែកៗប្រសិនបើវាធំ (ការត្រួតពិនិត្យការពិត VRAM 😭) ( ឃ្លាំង Real-ESRGAN (ជម្រើសក្រឡាក្បឿង) )
-
-
ការស្រង់ចេញលក្ខណៈពិសេស
-
ស្រទាប់ដំបូងៗរកឃើញគែម ជ្រុង និងជម្រាល
-
ស្រទាប់ជ្រៅៗរកឃើញលំនាំ៖ វាយនភាព រូបរាង សមាសធាតុផ្ទៃមុខ
-
-
ការកសាងឡើងវិញ
-
ម៉ូដែលនេះបង្កើតផែនទីលក្ខណៈពិសេសដែលមានគុណភាពបង្ហាញខ្ពស់ជាង
-
បន្ទាប់មកបម្លែងវាទៅជាទិន្នផលភីកសែលពិតប្រាកដ
-
-
ការកែច្នៃក្រោយ
-
ការធ្វើឱ្យច្បាស់ជាជម្រើស
-
ការកាត់បន្ថយសំឡេងរំខានជាជម្រើស
-
ការបង្ក្រាបវត្ថុបុរាណជាជម្រើស (សំឡេងរោទ៍ ហាឡូស ការរារាំង)
-
ព័ត៌មានលម្អិតដ៏ស្រទន់មួយ៖ ឧបករណ៍ជាច្រើនដែលមានទំហំធំជាងមុននៅក្នុងក្រឡាក្បឿង បន្ទាប់មកលាយថ្នេរ។ ឧបករណ៍ដ៏អស្ចារ្យលាក់ព្រំដែនក្រឡាក្បឿង។ ឧបករណ៍ Meh បន្សល់ទុកស្នាមក្រឡាចត្រង្គស្រអាប់ៗ ប្រសិនបើអ្នកសម្លឹងមើល។ ហើយបាទ/ចាស៎ អ្នកនឹងសម្លឹងមើល ពីព្រោះមនុស្សចូលចិត្តពិនិត្យមើលភាពមិនល្អឥតខ្ចោះតូចតាចនៅការពង្រីក 300% ដូចជាសត្វ Gremlins តូចៗ 🧌
គ្រួសារគំរូសំខាន់ៗដែលប្រើសម្រាប់ការបង្កើនប្រសិទ្ធភាព AI (និងមូលហេតុដែលពួកគេមានអារម្មណ៍ខុសគ្នា) 🤖📚
១) គុណភាពបង្ហាញខ្ពស់ដែលមានមូលដ្ឋានលើ CNN (ជាឧបករណ៍បុរាណ)
បណ្តាញសរសៃប្រសាទ Convolutional គឺពូកែខាងលំនាំក្នុងស្រុក៖ គែម វាយនភាព រចនាសម្ព័ន្ធតូចៗ ( រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ដោយប្រើបណ្តាញ Convolutional ជ្រៅ (SRCNN) )។
-
គុណសម្បត្តិ៖ លឿន មានស្ថេរភាព មានការភ្ញាក់ផ្អើលតិចជាងមុន
-
គុណវិបត្តិ៖ អាចមើលទៅហាក់ដូចជា "ដំណើរការ" បន្តិចប្រសិនបើត្រូវបានរុញច្រានខ្លាំង
2) ការបង្កើនគុណភាពរូបភាពដោយផ្អែកលើ GAN (រចនាប័ទ្ម ESRGAN) 🎭
GANs (Generative Adversarial Networks) បណ្តុះបណ្តាលម៉ាស៊ីនភ្លើងឱ្យផលិតរូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ ដែលឧបករណ៍រើសអើងមិនអាចបែងចែកពីរូបភាពពិតបាន ( Generative Adversarial Networks )។
-
គុណសម្បត្តិ៖ ព័ត៌មានលម្អិតដ៏មុតស្រួច វាយនភាពគួរឱ្យចាប់អារម្មណ៍
-
ចំណុចអវិជ្ជមាន៖ អាចបង្កើតព័ត៌មានលម្អិតដែលមិនមាន - ពេលខ្លះខុស ពេលខ្លះចម្លែក ( SRGAN , ESRGAN )
GAN អាចផ្តល់ឱ្យអ្នកនូវភាពច្បាស់ដែលគួរឱ្យភ្ញាក់ផ្អើល។ វាក៏អាចផ្តល់ឱ្យអ្នកនូវចិញ្ចើមបន្ថែមផងដែរ។ ដូច្នេះ... ជ្រើសរើសការប្រយុទ្ធរបស់អ្នក 😬
៣) ការបង្កើនទំហំដោយផ្អែកលើការសាយភាយ (តួអក្សរជំនួសច្នៃប្រឌិត) 🌫️➡️🖼️
ម៉ូដែលសាយភាយកាត់បន្ថយសំឡេងរំខានមួយជំហានម្តងៗ ហើយអាចត្រូវបានណែនាំដើម្បីបង្កើតព័ត៌មានលម្អិតដែលមានគុណភាពបង្ហាញខ្ពស់ ( SR3 )។
-
គុណសម្បត្តិ៖ អាចពូកែខាងព័ត៌មានលម្អិតគួរឱ្យជឿជាក់ ជាពិសេសសម្រាប់ការងារច្នៃប្រឌិត
-
ចំណុចអវិជ្ជមាន៖ អាចរសាត់ចេញពីអត្តសញ្ញាណ/រចនាសម្ព័ន្ធដើម ប្រសិនបើការកំណត់មានលក្ខណៈឈ្លានពាន ( SR3 )
នេះជាកន្លែងដែល “ការបង្កើនគុណភាពរូបភាព” ចាប់ផ្តើមលាយឡំជាមួយ “ការស្រមើស្រមៃឡើងវិញ”។ ពេលខ្លះនោះជាអ្វីដែលអ្នកចង់បាន។ ពេលខ្លះវាមិនមែនទេ។.
៤) ការបង្កើនគុណភាពវីដេអូជាមួយនឹងភាពស៊ីសង្វាក់គ្នាតាមពេលវេលា 🎞️
ការបង្កើនគុណភាពវីដេអូជារឿយៗបន្ថែមតក្កវិជ្ជាដែលដឹងពីចលនា៖
-
ប្រើស៊ុមជិតគ្នាដើម្បីធ្វើឱ្យលម្អិតមានស្ថេរភាព ( BasicVSR (CVPR 2021) )
-
ព្យាយាមជៀសវាងការភ្លឹបភ្លែតៗ និងវត្ថុបុរាណដែលវារ
-
ជារឿយៗផ្សំគុណភាពបង្ហាញខ្ពស់ជាមួយនឹង denoise និង deinterlacing ( វីដេអូ Topaz )
ប្រសិនបើការបង្កើនទំហំរូបភាពគឺដូចជាការស្ដារគំនូរមួយឡើងវិញ ការបង្កើនទំហំវីដេអូគឺដូចជាការស្ដារសៀវភៅត្រឡប់ឡើងវិញដោយមិនធ្វើឱ្យច្រមុះរបស់តួអង្គផ្លាស់ប្តូររូបរាងរាល់ទំព័រ។ ដែលវាពិបាកជាងវាស្តាប់ទៅទៅទៀត។.
ហេតុអ្វីបានជាការបង្កើនប្រសិទ្ធភាព AI ពេលខ្លះមើលទៅដូចជាក្លែងក្លាយ (និងរបៀបសម្គាល់វា) 👀🚩
ការបង្កើនគុណភាពរូបភាពដោយ AI បរាជ័យក្នុងវិធីដែលអាចសម្គាល់បាន។ នៅពេលដែលអ្នករៀនលំនាំទាំងនោះ អ្នកនឹងឃើញវាគ្រប់ទីកន្លែង ដូចជាការទិញឡានថ្មី ហើយស្រាប់តែសម្គាល់ឃើញម៉ូដែលនោះនៅគ្រប់ផ្លូវ 😵💫
ប្រជាប្រិយប្រាប់ថា៖
-
លាបក្រមួន លើស្បែកមុខ (បំបាត់សំឡេងរំខាន + ធ្វើឲ្យរលោងពេក)
-
ហាឡូដែលមុតពេក ជុំវិញគែម (តំបន់ "ហួសកម្រិត" បុរាណ) ( ការបញ្ចូលទ្វេភាគី )
-
វាយនភាពដដែលៗ (ជញ្ជាំងឥដ្ឋក្លាយជាលំនាំចម្លង-បិទភ្ជាប់)
-
ភាពផ្ទុយគ្នាតូចៗដ៏ស្រួយៗ ដែលស្រែកថា "ក្បួនដោះស្រាយ"
-
អត្ថបទខូចទ្រង់ទ្រាយ ដែលអក្សរក្លាយជាអក្សរស្ទើរតែទាំងស្រុង (ប្រភេទអាក្រក់បំផុត)
-
ការរសាត់បាត់ព័ត៌មានលម្អិត ដែលលក្ខណៈពិសេសតូចៗផ្លាស់ប្តូរបន្តិចបន្តួច ជាពិសេសនៅក្នុងលំហូរការងារផ្សព្វផ្សាយ ( SR3 )
ផ្នែកដ៏លំបាក៖ ពេលខ្លះវត្ថុបុរាណទាំងនេះមើលទៅ "ល្អជាង" គ្រាន់តែក្រឡេកមើលមួយភ្លែត។ ខួរក្បាលរបស់អ្នកចូលចិត្តភាពមុតស្រួច។ ប៉ុន្តែបន្ទាប់ពីមួយសន្ទុះ វាមានអារម្មណ៍ថា... ខុស។.
យុទ្ធសាស្ត្រល្អមួយគឺត្រូវពង្រីក ហើយពិនិត្យមើលថាតើវាមើលទៅធម្មជាតិឬអត់នៅចម្ងាយមើលធម្មតា។ ប្រសិនបើវាមើលទៅល្អត្រឹមតែពង្រីក 400% នោះមិនមែនជាជ័យជម្នះទេ នោះជាចំណង់ចំណូលចិត្ត 😅
របៀបដែល AI Upscaling ដំណើរការ៖ ផ្នែកបណ្តុះបណ្តាល ដោយមិនមានបញ្ហាគណិតវិទ្យា 📉🙂
ការបណ្តុះបណ្តាលម៉ូដែលដែលមានគុណភាពបង្ហាញខ្ពស់ជាធម្មតាពាក់ព័ន្ធនឹង៖
-
សំណុំទិន្នន័យដែលបានផ្គូផ្គង (ការបញ្ចូលដែលមានគុណភាពបង្ហាញទាប គោលដៅដែលមានគុណភាពបង្ហាញខ្ពស់) ( រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ដោយប្រើបណ្តាញ Deep Convolutional (SRCNN) )
-
មុខងារបាត់បង់ ដែលដាក់ទណ្ឌកម្មការកសាងឡើងវិញខុស ( SRGAN )
ប្រភេទនៃការខាតបង់ធម្មតា៖
-
ការបាត់បង់ភីកសែល (L1/L2)
លើកទឹកចិត្តឱ្យមានភាពត្រឹមត្រូវ។ អាចបង្កើតលទ្ធផលទន់បន្តិច។ -
ការបាត់បង់ការយល់ឃើញ
ប្រៀបធៀបលក្ខណៈពិសេសដែលជ្រៅជាង (ដូចជា "តើវា មើលទៅ ស្រដៀងគ្នាទេ") ជាជាងភីកសែលពិតប្រាកដ ( ការបាត់បង់ការយល់ឃើញ (Johnson et al., 2016) )។ -
ការខាតបង់ដោយគូប្រជែង (GAN)
លើកទឹកចិត្តឲ្យមានភាពប្រាកដនិយម ជួនកាលដោយខាតបង់ភាពត្រឹមត្រូវតាមន័យត្រង់ ( SRGAN , Generative Adversarial Networks )។
មានការអូសទាញឥតឈប់ឈរ៖
-
ធ្វើឱ្យវា ស្មោះត្រង់ នឹងច្បាប់ដើម
vs -
ធ្វើឱ្យវា មើលទៅគួរឱ្យចាប់អារម្មណ៍
ឧបករណ៍ផ្សេងៗគ្នាស្ថិតនៅកន្លែងផ្សេងៗគ្នានៅលើវិសាលគមនោះ។ ហើយអ្នកប្រហែលជាចូលចិត្តមួយអាស្រ័យលើថាតើអ្នកកំពុងស្ដាររូបថតគ្រួសារឡើងវិញ ឬរៀបចំផ្ទាំងរូបភាពដែល "រូបរាងស្អាត" សំខាន់ជាងភាពត្រឹមត្រូវខាងកោសល្យវិច្ច័យ។.
លំហូរការងារជាក់ស្តែង៖ រូបថត ស្កែនចាស់ៗ អានីមេ និងវីដេអូ 📸🧾🎥
រូបថត (រូបបញ្ឈរ ទេសភាព រូបថតផលិតផល)
ការអនុវត្តល្អបំផុតជាធម្មតាគឺ៖
-
បន្ថយសំឡេងរំខានបន្តិចបន្តួចជាមុនសិន (បើចាំបាច់)
-
កម្រិតខ្ពស់ជាមួយនឹងការកំណត់អភិរក្ស
-
បន្ថែមគ្រាប់ធញ្ញជាតិមកវិញ ប្រសិនបើរបស់របរមានអារម្មណ៍ថារលោងពេក (មែនហើយ ពិតជាដូច្នោះមែន)
គ្រាប់ធញ្ញជាតិប្រៀបដូចជាអំបិល។ ច្រើនពេកអាចបំផ្លាញអាហារពេលល្ងាចបាន ប៉ុន្តែគ្មានអ្វីអាចធ្វើឲ្យមានរសជាតិរាបស្មើបន្តិចសោះឡើយ 🍟
ការស្កេនចាស់ៗ និងរូបភាពដែលបានបង្ហាប់យ៉ាងខ្លាំង
ទាំងនេះពិបាកជាង ពីព្រោះគំរូអាចចាត់ទុកប្លុកបង្ហាប់ជា "វាយនភាព"។
សាកល្បង៖
-
ការដកយក ឬ ការបំបាត់ចោលនូវវត្ថុបុរាណ
-
បន្ទាប់មកកម្រិតខ្ពស់
-
បន្ទាប់មក ការធ្វើឱ្យច្បាស់ស្រាលៗ (កុំច្រើនពេក... ខ្ញុំដឹង មនុស្សគ្រប់គ្នានិយាយបែបនោះ ប៉ុន្តែនៅតែ)
អានីមេ និង សិល្បៈបន្ទាត់
សិល្បៈបន្ទាត់ទទួលបានអត្ថប្រយោជន៍ពី៖
-
ម៉ូដែលដែលរក្សាគែមស្អាត
-
ការបំភាន់វាយនភាពដែលកាត់បន្ថយ ការបង្កើនទំហំ
អានីមេជារឿយៗមើលទៅអស្ចារ្យព្រោះរូបរាងមានភាពសាមញ្ញ និងស៊ីសង្វាក់គ្នា។ (សំណាងណាស់)
វីដេអូ
វីដេអូបន្ថែមជំហានបន្ថែម៖
-
លុបបំបាត់សំឡេងរំខាន
-
ឌឺអ៊ីនធឺឡេស (សម្រាប់ប្រភពជាក់លាក់)
-
លំដាប់ខ្ពស់
-
ការធ្វើឱ្យរលោង ឬស្ថេរភាពតាមពេលវេលា ( BasicVSR (CVPR 2021) )
-
ការណែនាំគ្រាប់ធញ្ញជាតិឡើងវិញជាជម្រើសសម្រាប់ភាពស្អិតជាប់
ប្រសិនបើអ្នករំលងភាពស៊ីសង្វាក់គ្នាតាមពេលវេលា អ្នកនឹងទទួលបានព័ត៌មានលម្អិតភ្លឹបភ្លែតៗ។ នៅពេលដែលអ្នកសម្គាល់ឃើញវា អ្នកមិនអាចមើលវាចេញបានទេ។ ដូចជាកៅអីដែលមានសំឡេងគ្រហឹមៗនៅក្នុងបន្ទប់ស្ងាត់មួយ 😖
ការជ្រើសរើសការកំណត់ដោយមិនចាំបាច់ទាយច្រើនពេក (សន្លឹកបន្លំតូចមួយ) 🎛️😵💫
នេះជាផ្នត់គំនិតចាប់ផ្តើមដ៏ល្អមួយ៖
-
ប្រសិនបើមុខមើលទៅដូចប្លាស្ទិក
សូមកាត់បន្ថយការបន្ថយសំឡេងរំខាន កាត់បន្ថយការធ្វើឱ្យច្បាស់ សូមសាកល្បងម៉ូដែល ឬរបៀបដែលថែរក្សាមុខ។ -
ប្រសិនបើវាយនភាពមើលទៅខ្លាំងពេក
សូមបន្ថយគ្រាប់រំកិល “ការបង្កើនលម្អិត” ឬ “សង្គ្រោះព័ត៌មានលម្អិត” សូមបន្ថែមគ្រាប់ធញ្ញជាតិស្រាលៗបន្ទាប់ពីនោះ។ -
ប្រសិនបើគែមភ្លឺ
សូមបន្ថយការធ្វើឱ្យច្បាស់ សូមពិនិត្យមើលជម្រើសទប់ស្កាត់ហាឡូ។ -
ប្រសិនបើរូបភាពមើលទៅហាក់ដូចជា "AI" ពេក
ចូរប្រើវិធីអភិរក្សនិយមជាង។ ពេលខ្លះចលនាដ៏ល្អបំផុតគឺគ្រាន់តែ... តិចជាង។
ដូចគ្នានេះដែរ៖ កុំបង្កើនទំហំរូបភាព 8x គ្រាន់តែដោយសារតែអ្នកអាចធ្វើបាន។ 2x ឬ 4x ស្អាតជារឿយៗជាចំណុចល្អបំផុត។ ក្រៅពីនេះ អ្នកកំពុងសុំឱ្យម៉ូដែលសរសេររឿងប្រឌិតអំពីភីកសែលរបស់អ្នក 📖😂
សីលធម៌ ភាពត្រឹមត្រូវ និងសំណួរឆ្គងៗអំពី «សច្ចភាព» 🧭😬
ការបង្កើនទំហំ AI ធ្វើឱ្យបន្ទាត់មួយព្រិលៗ៖
-
ការស្ដារឡើងវិញមានន័យថា ការស្ដារឡើងវិញនូវអ្វីដែលមាន
-
ការបង្កើនប្រសិទ្ធភាពមានន័យថាបន្ថែមអ្វីដែលមិនមែន
ជាមួយរូបថតផ្ទាល់ខ្លួន ជាធម្មតាវាល្អ (និងស្រស់ស្អាត)។ ជាមួយសារព័ត៌មាន ភស្តុតាងផ្លូវច្បាប់ រូបភាពវេជ្ជសាស្ត្រ ឬអ្វីក៏ដោយដែលភាពស្មោះត្រង់មានសារៈសំខាន់... អ្នកត្រូវប្រុងប្រយ័ត្ន ( OSAC/NIST: មគ្គុទ្ទេសក៍ស្តង់ដារសម្រាប់ការគ្រប់គ្រងរូបភាពឌីជីថលកោសល្យវិច្ច័យ , គោលការណ៍ណែនាំ SWGDE សម្រាប់ការវិភាគរូបភាពកោសល្យវិច្ច័យ )។
ច្បាប់សាមញ្ញមួយ៖
-
ប្រសិនបើហានិភ័យខ្ពស់ សូមចាត់ទុកការបង្កើនទំហំ AI ជាឧទាហរណ៍ មិនមែន ជារឿងច្បាស់លាស់នោះទេ។
ម្យ៉ាងទៀត ការបង្ហាញព័ត៌មានក៏សំខាន់ផងដែរនៅក្នុងបរិបទវិជ្ជាជីវៈ។ មិនមែនដោយសារតែ AI ជាអំពើអាក្រក់នោះទេ ប៉ុន្តែដោយសារតែទស្សនិកជនសមនឹងទទួលបានព័ត៌មានថាតើព័ត៌មានលម្អិតត្រូវបានសាងសង់ឡើងវិញ ឬចាប់យកបានឬអត់។ នោះគ្រាន់តែជា… ការគោរព។.
កំណត់ចំណាំបិទបញ្ចប់ និងការសង្ខេបរហ័ស 🧡✅
ដូច្នេះ របៀបដែល AI Upscaling ដំណើរការ គឺ៖ ម៉ូដែលរៀនពីរបៀបដែលព័ត៌មានលម្អិតដែលមានគុណភាពបង្ហាញខ្ពស់ មានទំនោរ ទាក់ទងនឹងលំនាំដែលមានគុណភាពបង្ហាញទាប បន្ទាប់មកព្យាករណ៍ពីភីកសែលបន្ថែមដែលអាចទុកចិត្តបានក្នុងអំឡុងពេល upscaling ( ការរៀនសូត្រជ្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ )។ អាស្រ័យលើគ្រួសារម៉ូដែល (CNN, GAN, diffusion, video-temporal) ការព្យាករណ៍នោះអាចមានលក្ខណៈអភិរក្ស និងស្មោះត្រង់... ឬដិត និងពេលខ្លះមិនច្បាស់លាស់ 😅
សង្ខេបរហ័ស
-
ការបង្កើនទំហំបែបប្រពៃណីលាតសន្ធឹងភីកសែល ( Bicubic interpolation )
-
ការបង្កើនគុណភាពរូបភាពដោយ AI ព្យាករណ៍ពីព័ត៌មានលម្អិតដែលបាត់ដោយប្រើលំនាំដែលបានរៀន ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) )
-
លទ្ធផលដ៏អស្ចារ្យកើតចេញពីគំរូត្រឹមត្រូវ + ការអត់ធ្មត់
-
សូមប្រយ័ត្នចំពោះហាឡូ ផ្ទៃដូចក្រមួន វាយនភាពដដែលៗ និងភ្លឹបភ្លែតៗនៅក្នុងវីដេអូ ( BasicVSR (CVPR 2021) )
-
ការបង្កើនគុណភាពរូបភាព (Upscaling) ជារឿយៗគឺជា "ការកសាងឡើងវិញដែលអាចទុកចិត្តបាន" មិនមែនជាការពិតដ៏ល្អឥតខ្ចោះនោះទេ ( SRGAN , ESRGAN )
ប្រសិនបើអ្នកចង់បាន សូមប្រាប់ខ្ញុំពីអ្វីដែលអ្នកកំពុងធ្វើឱ្យប្រសើរឡើង (មុខ រូបថតចាស់ៗ វីដេអូ គំនូរជីវចល ការស្កេនអក្សរ) ហើយខ្ញុំនឹងស្នើយុទ្ធសាស្ត្រកំណត់ដែលមានទំនោរគេចពីគ្រោះថ្នាក់ទូទៅនៃ "រូបរាង AI" 🎯🙂
សំណួរដែលសួរញឹកញាប់
ការបង្កើនប្រសិទ្ធភាព AI និងរបៀបដែលវាដំណើរការ
ការបង្កើនគុណភាពបង្ហាញរូបភាពដោយ AI (ជារឿយៗត្រូវបានគេហៅថា "super-resolution") បង្កើនគុណភាពបង្ហាញរូបភាពដោយព្យាករណ៍ពីព័ត៌មានលម្អិតដែលមានគុណភាពបង្ហាញខ្ពស់ដែលបាត់ពីលំនាំដែលបានរៀនក្នុងអំឡុងពេលហ្វឹកហាត់។ ជំនួសឱ្យការលាតសន្ធឹងភីកសែលដូចជាការបញ្ចូល bicubic គំរូសិក្សាពីគែម វាយនភាព ផ្ទៃ និងបន្ទាត់ដូចអក្សរ បន្ទាប់មកបង្កើតទិន្នន័យភីកសែលថ្មីដែលស្របនឹងលំនាំដែលបានរៀនទាំងនោះ។ វាមិនសូវ "ស្តារការពិតឡើងវិញ" ទេ ប៉ុន្តែ "ធ្វើការស្មានដែលអាចទុកចិត្តបាន" ដែលអានថាធម្មជាតិ។.
ការបង្កើនទំហំ AI ធៀបនឹងការប្តូរទំហំ bicubic ឬបែបប្រពៃណី
វិធីសាស្ត្របង្កើនគុណភាពរូបភាពបែបប្រពៃណី (ដូចជា bicubic) ភាគច្រើនបញ្ចូលគ្នារវាងភីកសែលដែលមានស្រាប់ ដោយធ្វើឲ្យការផ្លាស់ប្តូររលូនដោយមិនបង្កើតព័ត៌មានលម្អិតថ្មីពិតប្រាកដ។ ការបង្កើនគុណភាពរូបភាពដោយ AI មានគោលបំណងកសាងរចនាសម្ព័ន្ធដែលអាចជឿទុកចិត្តឡើងវិញដោយការសម្គាល់សញ្ញាដែលមើលឃើញ និងព្យាករណ៍ពីអ្វីដែលកំណែដែលមានគុណភាពបង្ហាញខ្ពស់នៃសញ្ញាទាំងនោះមានទំនោរទៅជារូបរាង។ នោះហើយជាមូលហេតុដែលលទ្ធផល AI អាចមានអារម្មណ៍ច្បាស់ជាងមុន ហើយក៏ជាមូលហេតុដែលពួកគេអាចណែនាំវត្ថុបុរាណ ឬ "បង្កើត" ព័ត៌មានលម្អិតដែលមិនមាននៅក្នុងប្រភព។.
ហេតុអ្វីបានជាមុខអាចមើលទៅមានក្រមួន ឬរលោងពេក
មុខដែលមានសភាពដូចក្រមួនជាធម្មតាកើតចេញពីការកាត់បន្ថយសំឡេងរំខាន និងការធ្វើឱ្យរលោងយ៉ាងខ្លាំងក្លា រួមផ្សំជាមួយនឹងការធ្វើឱ្យច្បាស់ដែលលុបចេញនូវវាយនភាពស្បែកធម្មជាតិ។ ឧបករណ៍ជាច្រើនព្យាបាលសំឡេងរំខាន និងវាយនភាពល្អិតល្អន់ដូចគ្នា ដូច្នេះការ "សម្អាត" រូបភាពអាចលុបរន្ធញើស និងព័ត៌មានលម្អិតស្រទន់។ វិធីសាស្រ្តទូទៅមួយគឺកាត់បន្ថយការកាត់បន្ថយសំឡេងរំខាន និងការធ្វើឱ្យច្បាស់ ប្រើរបៀបថែរក្សាមុខប្រសិនបើមាន បន្ទាប់មកបញ្ចូលគ្រាប់ធញ្ញជាតិឡើងវិញដើម្បីឱ្យលទ្ធផលមើលទៅមិនសូវប្លាស្ទិក និងមានភាពទាក់ទាញជាងមុន។.
វត្ថុបុរាណបង្កើនទំហំ AI ទូទៅដែលត្រូវតាមដាន
ការបង្ហាញជាធម្មតារួមមានរាងហាឡូជុំវិញគែម លំនាំវាយនភាពដដែលៗ (ដូចជាឥដ្ឋចម្លង-បិទភ្ជាប់) ភាពផ្ទុយគ្នាតូចៗស្រួយៗ និងអក្សរដែលប្រែទៅជា "ស្ទើរតែជាអក្សរ"។ នៅក្នុងលំហូរការងារដែលផ្អែកលើការសាយភាយ អ្នកក៏អាចមើលឃើញការរសាត់នៃព័ត៌មានលម្អិតដែលលក្ខណៈពិសេសតូចៗផ្លាស់ប្តូរយ៉ាងស្ទាត់ជំនាញ។ សម្រាប់វីដេអូ ការភ្លឹបភ្លែតៗ និងព័ត៌មានលម្អិតវារឆ្លងកាត់ស៊ុមគឺជាសញ្ញាព្រមានធំៗ។ ប្រសិនបើវាមើលទៅល្អតែនៅពេលពង្រីកខ្លាំងពេក ការកំណត់ប្រហែលជាឈ្លានពានពេក។.
របៀបដែល GAN, CNN និង diffusion upscalers មានទំនោរខុសគ្នានៅក្នុងលទ្ធផល
គុណភាពបង្ហាញខ្ពស់ដែលមានមូលដ្ឋានលើ CNN មានទំនោរទៅរកភាពស្ថិតស្ថេរ និងអាចទស្សន៍ទាយបានច្រើនជាង ប៉ុន្តែវាអាចមើលទៅ "ដំណើរការ" ប្រសិនបើត្រូវបានជំរុញយ៉ាងខ្លាំង។ ជម្រើសដែលមានមូលដ្ឋានលើ GAN (រចនាប័ទ្ម ESRGAN) ជារឿយៗបង្កើតវាយនភាពដ៏មុតស្រួច និងភាពមុតស្រួចដែលយល់ឃើញ ប៉ុន្តែពួកវាអាចបំភាន់ព័ត៌មានលម្អិតមិនត្រឹមត្រូវ ជាពិសេសនៅលើផ្ទៃ។ ការបង្កើនមាត្រដ្ឋានដែលមានមូលដ្ឋានលើឌីហ្វ្លុយស៊ីសអាចបង្កើតព័ត៌មានលម្អិតដ៏ស្រស់ស្អាត និងសមហេតុផល ប៉ុន្តែវាអាចរសាត់ចេញពីរចនាសម្ព័ន្ធដើម ប្រសិនបើការកំណត់ការណែនាំ ឬកម្លាំងខ្លាំងពេក។.
យុទ្ធសាស្ត្រកំណត់ជាក់ស្តែងសម្រាប់ជៀសវាងរូបរាង "AI ពេក"
ចាប់ផ្តើមអភិរក្សនិយម៖ បង្កើនទំហំ 2× ឬ 4× មុនពេលឈានដល់កត្តាខ្លាំង។ ប្រសិនបើមុខមើលទៅដូចប្លាស្ទិក សូមបន្ថយសំឡេងរំខាន និងការធ្វើឱ្យច្បាស់ ហើយសាកល្បងរបៀបស្គាល់មុខ។ ប្រសិនបើវាយនភាពខ្លាំងពេក សូមបន្ថយការបង្កើនព័ត៌មានលម្អិត ហើយពិចារណាបន្ថែមគ្រាប់ធញ្ញជាតិបន្តិចបន្តួចបន្ទាប់ពីនោះ។ ប្រសិនបើគែមភ្លឺ សូមកាត់បន្ថយការធ្វើឱ្យច្បាស់ ហើយពិនិត្យមើលការបង្ក្រាបហាឡូ ឬវត្ថុបុរាណ។ នៅក្នុងបំពង់ជាច្រើន "តិច" ឈ្នះព្រោះវារក្សាភាពប្រាកដនិយមដែលអាចទុកចិត្តបាន។.
ការដោះស្រាយរូបភាពស្កេនចាស់ៗ ឬរូបភាពដែលបានបង្ហាប់ JPEG យ៉ាងច្រើនមុនពេលបង្កើនទំហំ
រូបភាពដែលបានបង្ហាប់គឺពិបាកណាស់ ពីព្រោះម៉ូដែលអាចចាត់ទុកវត្ថុបុរាណនៃប្លុកជាវាយនភាពពិត ហើយពង្រីកវា។ លំហូរការងារទូទៅមួយគឺការដកយកវត្ថុបុរាណចេញ ឬការបំបាត់ការរារាំងជាមុនសិន បន្ទាប់មកការបង្កើនទំហំ បន្ទាប់មកការធ្វើឱ្យច្បាស់ស្រាលៗ លុះត្រាតែចាំបាច់។ សម្រាប់ការស្កេន ការសម្អាតថ្នមៗអាចជួយម៉ូដែលផ្តោតលើរចនាសម្ព័ន្ធពិតប្រាកដជាជាងការខូចខាត។ គោលដៅគឺដើម្បីកាត់បន្ថយ "សញ្ញាវាយនភាពក្លែងក្លាយ" ដូច្នេះឧបករណ៍បង្កើនទំហំមិនត្រូវបានបង្ខំឱ្យធ្វើការស្មានដោយទំនុកចិត្តពីការបញ្ចូលសំឡេងរំខាននោះទេ។.
ហេតុអ្វីបានជាការបង្កើនគុណភាពវីដេអូពិបាកជាងការបង្កើនគុណភាពរូបថត
ការបង្កើនគុណភាពវីដេអូត្រូវតែស៊ីសង្វាក់គ្នានៅទូទាំងស៊ុម មិនមែនគ្រាន់តែល្អនៅលើរូបភាពមួយនោះទេ។ ប្រសិនបើព័ត៌មានលម្អិតភ្លឹបភ្លែតៗពីស៊ុមមួយទៅស៊ុមមួយ លទ្ធផលនឹងក្លាយទៅជារំខានយ៉ាងឆាប់រហ័ស។ វិធីសាស្រ្តផ្តោតលើវីដេអូប្រើព័ត៌មានបណ្ដោះអាសន្នពីស៊ុមជិតខាងដើម្បីធ្វើឱ្យការកសាងឡើងវិញមានស្ថេរភាព និងជៀសវាងវត្ថុបុរាណដែលភ្លឺចែងចាំង។ លំហូរការងារជាច្រើនក៏រួមបញ្ចូល denoise, deinterlacing សម្រាប់ប្រភពជាក់លាក់ និងការណែនាំឡើងវិញនូវគ្រាប់ធញ្ញជាតិជាជម្រើស ដូច្នេះលំដាប់ទាំងមូលមានអារម្មណ៍ស៊ីសង្វាក់គ្នាជាជាងភាពមុតស្រួចសិប្បនិម្មិត។.
នៅពេលដែលការបង្កើនប្រសិទ្ធភាព AI មិនសមរម្យ ឬមានហានិភ័យក្នុងការពឹងផ្អែក
ការបង្កើនប្រសិទ្ធភាព AI ត្រូវបានចាត់ទុកថាជាការបង្កើនប្រសិទ្ធភាព មិនមែនជាភស្តុតាងទេ។ នៅក្នុងបរិបទដែលមានហានិភ័យខ្ពស់ដូចជា សារព័ត៌មាន ភស្តុតាងផ្លូវច្បាប់ រូបភាពវេជ្ជសាស្ត្រ ឬការងារកោសល្យវិច្ច័យ ការបង្កើតភីកសែល "គួរឱ្យជឿជាក់" អាចនាំឱ្យយល់ច្រឡំ ព្រោះវាអាចបន្ថែមព័ត៌មានលម្អិតដែលមិនត្រូវបានចាប់យក។ ការកំណត់ដែលមានសុវត្ថិភាពជាងគឺការប្រើប្រាស់វាដោយបង្ហាញជាឧទាហរណ៍ និងបង្ហាញថាដំណើរការ AI បានបង្កើតព័ត៌មានលម្អិតឡើងវិញ។ ប្រសិនបើភាពស្មោះត្រង់គឺមានសារៈសំខាន់ សូមរក្សាឯកសារដើម និងកត់ត្រាជំហានដំណើរការ និងការកំណត់នីមួយៗ។.
ឯកសារយោង
-
arXiv - ការរៀនសូត្រស៊ីជម្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ - arxiv.org
-
arXiv - រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ដោយប្រើបណ្តាញ Deep Convolutional (SRCNN) - arxiv.org
-
arXiv - Real-ESRGAN - arxiv.org
-
arXiv - ESRGAN - arxiv.org
-
arXiv - SR3 - arxiv.org
-
អ្នកអភិវឌ្ឍន៍ NVIDIA - NVIDIA DLSS - developer.nvidia.com
-
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
-
ការចូលប្រើប្រាស់ដោយសេរីរបស់មូលនិធិចក្ខុវិស័យកុំព្យូទ័រ (CVF) - BasicVSR៖ ការស្វែងរកសមាសធាតុសំខាន់ៗនៅក្នុងវីដេអូដែលមានគុណភាពបង្ហាញខ្ពស់ (CVPR 2021) - openaccess.thecvf.com
-
arXiv - បណ្តាញប្រឆាំងបង្កើត - arxiv.org
-
arXiv - SRGAN - arxiv.org
-
arXiv - ការបាត់បង់ការយល់ឃើញ (Johnson et al., 2016) - arxiv.org
-
GitHub - ឃ្លាំង Real-ESRGAN (ជម្រើសក្រឡាក្បឿង) - github.com
-
វិគីភីឌា - ការបញ្ចូលប៊ីគុប៊ីក - wikipedia.org
-
មន្ទីរពិសោធន៍ Topaz - រូបថត Topaz - topazlabs.com
-
មន្ទីរពិសោធន៍ Topaz - វីដេអូ Topaz - topazlabs.com
-
មជ្ឈមណ្ឌលជំនួយ Adobe - Adobe Enhance > គុណភាពបង្ហាញខ្ពស់ - helpx.adobe.com
-
NIST / OSAC - មគ្គុទ្ទេសក៍ស្តង់ដារសម្រាប់ការគ្រប់គ្រងរូបភាពឌីជីថលកោសល្យវិច្ច័យ (កំណែ 1.0) - nist.gov
-
SWGDE - គោលការណ៍ណែនាំសម្រាប់ការវិភាគរូបភាពកោសល្យវិច្ច័យ - swgde.org