តើការបង្កើនប្រសិទ្ធភាព AI ដំណើរការយ៉ាងដូចម្តេច

តើ AI Upscaling ដំណើរការយ៉ាងដូចម្តេច?

ចម្លើយខ្លី៖ ការបង្កើនគុណភាពបង្ហាញដោយ AI ដំណើរការដោយការហ្វឹកហាត់គំរូលើរូបភាពដែលមានគុណភាពបង្ហាញទាប និងខ្ពស់ដែលបានផ្គូផ្គង បន្ទាប់មកប្រើវាដើម្បីទស្សន៍ទាយភីកសែលបន្ថែមដែលអាចទុកចិត្តបានក្នុងអំឡុងពេលបង្កើនគុណភាពបង្ហាញ។ ប្រសិនបើគំរូបានឃើញវាយនភាព ឬមុខស្រដៀងគ្នានៅក្នុងការហ្វឹកហាត់ វាអាចបន្ថែមព័ត៌មានលម្អិតដែលគួរឱ្យជឿជាក់។ បើមិនដូច្នោះទេ វាអាច "បំភាន់" វត្ថុបុរាណដូចជាហាឡូ ស្បែកដូចក្រមួន ឬភ្លឹបភ្លែតៗនៅក្នុងវីដេអូ។

ចំណុចសំខាន់ៗ៖

ការព្យាករណ៍ ៖ គំរូនេះបង្កើតព័ត៌មានលម្អិតដែលអាចទុកចិត្តបាន មិនមែនជាការកសាងឡើងវិញនូវការពិតដែលធានានោះទេ។

ជម្រើសម៉ូដែល ៖ CNN មានទំនោរមានស្ថេរភាពជាង; GAN អាចមើលទៅច្បាស់ជាង ប៉ុន្តែមានហានិភ័យក្នុងការបង្កើតលក្ខណៈពិសេស។

ការត្រួតពិនិត្យវត្ថុបុរាណ ៖ ប្រយ័ត្នចំពោះហាឡូ វាយនភាពដដែលៗ "ស្ទើរតែជាអក្សរ" និងមុខប្លាស្ទិក។

ស្ថេរភាពវីដេអូ ៖ ប្រើវិធីសាស្ត្រតាមពេលវេលា បើមិនដូច្នោះទេ អ្នកនឹងឃើញពន្លឺភ្លឹបភ្លែតៗ និងរសាត់ពីស៊ុមមួយទៅស៊ុមមួយ។

ការប្រើប្រាស់ដែលមានហានិភ័យខ្ពស់ ៖ ប្រសិនបើភាពត្រឹមត្រូវមានសារៈសំខាន់ សូមបង្ហាញអំពីដំណើរការ និងចាត់ទុកលទ្ធផលជាឧទាហរណ៍។

តើការបង្កើនទំហំ AI ដំណើរការយ៉ាងដូចម្តេច? រូបភាព Infographic។.

អ្នកប្រហែលជាធ្លាប់បានឃើញវាហើយ៖ រូបភាពតូចមួយដែលស្រួយៗប្រែទៅជាអ្វីមួយដែលស្រួយៗគ្រប់គ្រាន់ដើម្បីបោះពុម្ព ផ្សាយ ឬទម្លាក់ចូលទៅក្នុងបទបង្ហាញដោយមិនញញើត។ វាមានអារម្មណ៍ដូចជាការបន្លំ។ ហើយ - តាមរបៀបដ៏ល្អបំផុត - វាពិតជាដូច្នោះមែន 😅

ដូច្នេះ របៀបដែល AI Upscaling ដំណើរការ គឺអាស្រ័យទៅលើអ្វីមួយដែលជាក់លាក់ជាង “កុំព្យូទ័របង្កើនព័ត៌មានលម្អិត” (រលកដៃ) និងកាន់តែខិតជិត “គំរូមួយព្យាករណ៍រចនាសម្ព័ន្ធដែលមានគុណភាពបង្ហាញខ្ពស់ដែលអាចទុកចិត្តបានដោយផ្អែកលើគំរូដែលវាបានរៀនពីឧទាហរណ៍ជាច្រើន” ( ការរៀនសូត្រជ្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ )។ ជំហានព្យាករណ៍នោះគឺជាហ្គេមទាំងមូល - ហើយវាជាមូលហេតុដែល AI Upscaling អាចមើលទៅគួរឱ្យភ្ញាក់ផ្អើល… ឬប្លាស្ទិកបន្តិច… ឬដូចជាឆ្មារបស់អ្នកដុះពុកមាត់បន្ថែម។

អត្ថបទដែលអ្នកប្រហែលជាចង់អានបន្ទាប់ពីអត្ថបទនេះ៖

🔗 របៀបដែល AI ដំណើរការ
រៀនមូលដ្ឋានគ្រឹះនៃគំរូ ទិន្នន័យ និងការសន្និដ្ឋាននៅក្នុង AI។.

🔗 របៀបដែល AI រៀន
មើលពីរបៀបដែលទិន្នន័យបណ្តុះបណ្តាល និងមតិកែលម្អធ្វើអោយប្រសើរឡើងនូវដំណើរការគំរូតាមពេលវេលា។.

🔗 របៀបដែល AI រកឃើញភាពមិនប្រក្រតី
យល់ពីលំនាំមូលដ្ឋាន និងរបៀបដែល AI សម្គាល់ឥរិយាបថមិនប្រក្រតីយ៉ាងរហ័ស។.

🔗 របៀបដែល AI ព្យាករណ៍និន្នាការ
ស្វែងយល់ពីវិធីសាស្ត្រព្យាករណ៍ដែលសម្គាល់សញ្ញា និងព្យាករណ៍ពីតម្រូវការនាពេលអនាគត។.


របៀបដែល AI Upscaling ដំណើរការ៖ គំនិតស្នូល នៅក្នុងពាក្យប្រចាំថ្ងៃ 🧩

ការបង្កើនគុណភាពបង្ហាញមានន័យថាការបង្កើនគុណភាពបង្ហាញ៖ ភីកសែលកាន់តែច្រើន រូបភាពធំជាង។ ការបង្កើនគុណភាពបង្ហាញបែបប្រពៃណី (ដូចជា bicubic) ជាទូទៅលាតសន្ធឹងភីកសែល និងធ្វើឱ្យការផ្លាស់ប្តូររលូន ( ការបញ្ចូលចន្លោះ Bicubic )។ វាល្អ ប៉ុន្តែវាមិនអាចបង្កើត ថ្មី - វាគ្រាន់តែបញ្ចូលចន្លោះប៉ុណ្ណោះ។

ការបង្កើនគុណភាពរូបភាពដោយ AI សាកល្បងអ្វីដែលដិតជាងនេះ (ហៅថា "គុណភាពបង្ហាញខ្ពស់" នៅក្នុងពិភពស្រាវជ្រាវ) ( ការរៀនសូត្រយ៉ាងស៊ីជម្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ )៖

  • វាពិនិត្យមើលការបញ្ចូលដែលមានគុណភាពបង្ហាញទាប

  • ស្គាល់លំនាំ (គែម វាយនភាព លក្ខណៈពិសេសលើផ្ទៃមុខ ស្នាមអក្សរ ការត្បាញក្រណាត់...)

  • រូបរាង របស់កំណែដែលមានគុណភាពបង្ហាញ ខ្ពស់

  • បង្កើតទិន្នន័យភីកសែលបន្ថែមដែលសមនឹងលំនាំទាំងនោះ

មិនមែន «ស្តារការពិតឡើងវិញយ៉ាងល្អឥតខ្ចោះ» ទេ ដូចជា «ធ្វើការស្មានដែលអាចទុកចិត្តបានខ្ពស់» ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) )។ ប្រសិនបើវាស្តាប់ទៅគួរឱ្យសង្ស័យបន្តិច អ្នកមិនខុសទេ - ប៉ុន្តែវាក៏ជាមូលហេតុដែលវាដំណើរការបានល្អដែរ 😄

ហើយមែនហើយ នេះមានន័យថា ការបង្កើនគុណភាពរូបភាពដោយ AI ជាទូទៅគឺជាការគ្រប់គ្រងការយល់ច្រឡំ… ប៉ុន្តែតាមរបៀបដែលមានផលិតភាព និងគោរពភីកសែល។.


តើ​អ្វី​ទៅ​ដែល​ធ្វើ​ឱ្យ​ការ​បង្កើន​ទំហំ​ដោយ​ AI មាន​លក្ខណៈ​ល្អ? ✅🛠️

ប្រសិនបើអ្នកកំពុងវិនិច្ឆ័យឧបករណ៍បង្កើនប្រសិទ្ធភាព AI (ឬការកំណត់ជាមុន) នេះជាអ្វីដែលទំនងជាសំខាន់បំផុត៖

  • ការស្ដារឡើងវិញនូវព័ត៌មានលម្អិតដោយមិនចាំបាច់ចម្អិនច្រើនពេក
    ការបង្កើនគុណភាពល្អបន្ថែមភាពក្រៀម និងរចនាសម្ព័ន្ធ មិនមែនជាសំឡេងក្រៀម ឬរន្ធញើសក្លែងក្លាយនោះទេ។

  • វិន័យគែម
    បន្ទាត់ស្អាតនៅតែស្អាត។ ម៉ូដែលមិនល្អធ្វើឱ្យគែមរង្គើ ឬដុះចេញជារាងហាឡូ។

  • ភាពប្រាកដនិយមនៃវាយនភាព
    សក់មិនគួរក្លាយជាស្នាមជក់លាបពណ៌ទេ។ ឥដ្ឋមិនគួរក្លាយជាត្រាលំនាំដដែលៗទេ។

  • ការដោះស្រាយសំឡេងរំខាន និងការបង្ហាប់
    រូបភាពប្រចាំថ្ងៃជាច្រើនត្រូវបានបំលែងជា JPEG រហូតដល់ខូច។ ឧបករណ៍បង្កើនគុណភាពរូបភាពល្អមិនបង្កើនការខូចខាតនោះទេ ( Real-ESRGAN )។

  • ការយល់ដឹងអំពីមុខ និងអក្សរ មុខ
    និងអក្សរគឺជាកន្លែងដែលងាយស្រួលបំផុតក្នុងការរកឃើញកំហុស។ គំរូល្អៗប្រព្រឹត្តចំពោះពួកគេដោយថ្នមៗ (ឬមានរបៀបពិសេស)។

  • ភាពស៊ីសង្វាក់គ្នានៅទូទាំងស៊ុម (សម្រាប់វីដេអូ)
    ប្រសិនបើព័ត៌មានលម្អិតភ្លឹបភ្លែតៗពីស៊ុមមួយទៅស៊ុមមួយ ភ្នែករបស់អ្នកនឹងស្រែក។ ការបង្កើនទំហំវីដេអូរស់ ឬស្លាប់ដោយសារស្ថេរភាពបណ្ដោះអាសន្ន ( BasicVSR (CVPR 2021) )។

  • ការគ្រប់គ្រងដែលសមហេតុផល
    អ្នកចង់បានគ្រាប់រំកិលដែលផ្គូផ្គងទៅនឹងលទ្ធផលពិតប្រាកដ៖ ការលុបបំបាត់សំលេងរំខាន ការបំបាត់ភាពមិនច្បាស់ ការដកយកវត្ថុបុរាណ ការរក្សាគ្រាប់ធញ្ញជាតិ ការធ្វើឱ្យច្បាស់... របស់របរជាក់ស្តែង។

ច្បាប់ស្ងប់ស្ងាត់មួយដែលនៅតែត្រូវអនុវត្ត៖ ការបង្កើនគុណភាពរូបភាព "ល្អបំផុត" ជារឿយៗគឺជាអ្វីដែលអ្នកស្ទើរតែមិនកត់សម្គាល់។ វាមើលទៅដូចជាអ្នកមានកាមេរ៉ាល្អជាងតាំងពីដំបូង 📷✨


តារាងប្រៀបធៀប៖ ជម្រើសបង្កើនប្រសិទ្ធភាព AI ដ៏ពេញនិយម (និងអ្វីដែលវាល្អសម្រាប់) 📊🙂

ខាងក្រោមនេះជាការប្រៀបធៀបជាក់ស្តែង។ តម្លៃមានភាពមិនច្បាស់លាស់ដោយចេតនា ពីព្រោះឧបករណ៍ប្រែប្រួលទៅតាមអាជ្ញាប័ណ្ណ កញ្ចប់ តម្លៃកុំព្យូទ័រ និងរបស់របរសប្បាយៗទាំងអស់។.

ឧបករណ៍ / វិធីសាស្រ្ត ល្អបំផុតសម្រាប់ អារម្មណ៍តម្លៃ ហេតុអ្វីបានជាវាដំណើរការ (ប្រហែល)
ឧបករណ៍បង្កើនគុណភាពរូបភាពលើតុបែប Topaz ( រូបថត Topaz , វីដេអូ Topaz ) រូបថត វីដេអូ លំហូរការងារងាយស្រួល បង់ប្រាក់បែប ម៉ូដែលទូទៅដ៏រឹងមាំ + ការលៃតម្រូវច្រើន មានទំនោរ "គ្រាន់តែដំណើរការ" ... ភាគច្រើន
លក្ខណៈពិសេសប្រភេទ "Super Resolution" របស់ Adobe ( Adobe Enhance > Super Resolution ) អ្នកថតរូបរួចហើយនៅក្នុងប្រព័ន្ធអេកូឡូស៊ីនោះ ការជាវ-y ការកសាងឡើងវិញនូវព័ត៌មានលម្អិតរឹងមាំ ជាធម្មតាមានលក្ខណៈអភិរក្សនិយម (មិនសូវមានភាពទាក់ទាញ)
វ៉ារ្យ៉ង់ Real-ESRGAN / ESRGAN ( Real-ESRGAN , ESRGAN ) ការងារ DIY, អ្នកអភិវឌ្ឍន៍, ការងារជាបាច់ ឥតគិតថ្លៃ (ប៉ុន្តែចំណាយពេលវេលា) ពូកែខាងវាយនភាពលម្អិត អាចហឹរលើមុខប្រសិនបើអ្នកមិនប្រយ័ត្ន
របៀបបង្កើនគុណភាពសំឡេងដោយផ្អែកលើការសាយភាយ ( SR3 ) ការងារច្នៃប្រឌិត លទ្ធផលដែលមានរចនាប័ទ្ម លាយ អាចបង្កើតព័ត៌មានលម្អិតដ៏ស្រស់ស្អាត - ក៏អាចបង្កើតរឿងមិនសមហេតុផលផងដែរ ដូច្នេះ... មែនហើយ
ឧបករណ៍បង្កើនគុណភាពហ្គេម (រចនាប័ទ្ម DLSS/FSR) ( Nvidia DLSS , AMD FSR 2 ) ការលេងហ្គេម និងការបង្ហាញរូបភាពតាមពេលវេលាជាក់ស្តែង កញ្ចប់ ប្រើប្រាស់ទិន្នន័យចលនា និងអាទិភាពដែលបានរៀន - ឈ្នះលើដំណើរការរលូន 🕹️
សេវាកម្មបង្កើនទំហំ Cloud ភាពងាយស្រួល ជ័យជម្នះរហ័ស បង់ប្រាក់សម្រាប់ការប្រើប្រាស់ម្តង លឿន + អាចធ្វើមាត្រដ្ឋានបាន ប៉ុន្តែអ្នកអាចធ្វើពាណិជ្ជកម្មលើការគ្រប់គ្រង និងពេលខ្លះមានភាពប៉ិនប្រសប់
កម្មវិធីបង្កើនគុណភាពរូបភាពដោយ AI ដែលផ្តោតលើវីដេអូ ( BasicVSR , Topaz Video ) វីដេអូចាស់ៗ, អានីមេ, បណ្ណសារ បង់ប្រាក់បែប ល្បិចពេលវេលាដើម្បីកាត់បន្ថយការភ្លឹបភ្លែតៗ + ម៉ូដែលវីដេអូឯកទេស
ការបង្កើនគុណភាពរូបភាព/រូបភាពតាមទូរស័ព្ទឆ្លាតវៃ ការប្រើប្រាស់ធម្មតា រួមបញ្ចូល ម៉ូដែលទម្ងន់ស្រាលត្រូវបានកែសម្រួលសម្រាប់ទិន្នផលដ៏ពេញចិត្ត មិនមែនភាពល្អឥតខ្ចោះទេ (នៅតែងាយស្រួលប្រើ)

ការសារភាពអំពីការធ្វើទ្រង់ទ្រាយ quirk៖ “Paid-ish” កំពុងធ្វើការងារច្រើននៅក្នុងតារាងនោះ។ ប៉ុន្តែអ្នកយល់ពីគំនិតហើយ 😅


អាថ៌កំបាំងដ៏ធំ៖ តារាម៉ូដែលរៀនគូសផែនទីពីគុណភាពបង្ហាញទាបទៅគុណភាពបង្ហាញខ្ពស់ 🧠➡️🖼️

នៅ​ក្នុង​ចំណុច​ស្នូល​នៃ​ការ​បង្កើន​គុណភាព​រូបភាព​ដោយ​ប្រើ​បច្ចេកវិទ្យា AI ភាគច្រើន​គឺ​ការ​រៀបចំ​ការ​រៀន​ដែល​មាន​ការ​ត្រួតពិនិត្យ ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) )៖

  1. ចាប់ផ្តើមជាមួយរូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ ("ការពិត")

  2. បន្ថយ​ពួកវា​ទៅជា​កំណែ​ដែលមាន​គុណភាពបង្ហាញ​ទាប ("ការបញ្ចូល")

  3. ហ្វឹកហាត់គំរូមួយដើម្បីកសាងឡើងវិញនូវគុណភាពបង្ហាញខ្ពស់ដើមពីគុណភាពបង្ហាញទាប

យូរៗទៅ គំរូនេះរៀនពីទំនាក់ទំនងដូចជា៖

  • «ភាពព្រិលៗបែបនេះនៅជុំវិញភ្នែកជាធម្មតាជាកម្មសិទ្ធិរបស់រោមភ្នែក»

  • "ចង្កោមភីកសែលនេះច្រើនតែបង្ហាញអក្សរ serif"

  • «ជម្រាលគែមនេះមើលទៅដូចជាខ្សែដំបូល មិនមែនជាសំឡេងរំខានចៃដន្យទេ»

វាមិនមែនជាការទន្ទេញចាំរូបភាពជាក់លាក់ណាមួយទេ (ក្នុងន័យសាមញ្ញ) វាកំពុងរៀនរចនាសម្ព័ន្ធស្ថិតិ ( ការរៀនសូត្រស៊ីជម្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ )។ សូមគិតថាវាដូចជាការរៀនវេយ្យាករណ៍នៃវាយនភាព និងគែម។ មិនមែនជាវេយ្យាករណ៍កំណាព្យទេ ដូចជា… វេយ្យាករណ៍សៀវភៅណែនាំ IKEA 🪑📦 (ពាក្យប្រៀបធៀបមិនសមហេតុផល ប៉ុន្តែជិតគ្រប់គ្រាន់)។


ចំណុចសំខាន់ៗ៖ អ្វីដែលកើតឡើងក្នុងអំឡុងពេលសន្និដ្ឋាន (នៅពេលអ្នកធ្វើឱ្យប្រសើរឡើង) ⚙️✨

នៅពេលអ្នកបញ្ចូលរូបភាពទៅក្នុង AI upscaler ជាធម្មតាមាន pipeline ដូចនេះ៖

  • ការកែច្នៃជាមុន

    • បម្លែង​ចន្លោះ​ពណ៌ (ពេលខ្លះ)

    • ធ្វើឱ្យតម្លៃភីកសែលមានលក្ខណៈធម្មតា

    • តម្រៀបរូបភាពជាបំណែកៗប្រសិនបើវាធំ (ការត្រួតពិនិត្យការពិត VRAM 😭) ( ឃ្លាំង Real-ESRGAN (ជម្រើសក្រឡាក្បឿង) )

  • ការស្រង់ចេញលក្ខណៈពិសេស

    • ស្រទាប់ដំបូងៗរកឃើញគែម ជ្រុង និងជម្រាល

    • ស្រទាប់ជ្រៅៗរកឃើញលំនាំ៖ វាយនភាព រូបរាង សមាសធាតុផ្ទៃមុខ

  • ការកសាងឡើងវិញ

    • ម៉ូដែលនេះបង្កើតផែនទីលក្ខណៈពិសេសដែលមានគុណភាពបង្ហាញខ្ពស់ជាង

    • បន្ទាប់មកបម្លែងវាទៅជាទិន្នផលភីកសែលពិតប្រាកដ

  • ការកែច្នៃក្រោយ

    • ការធ្វើឱ្យច្បាស់ជាជម្រើស

    • ការកាត់បន្ថយសំឡេងរំខានជាជម្រើស

    • ការបង្ក្រាបវត្ថុបុរាណជាជម្រើស (សំឡេងរោទ៍ ហាឡូស ការរារាំង)

ព័ត៌មានលម្អិតដ៏ស្រទន់មួយ៖ ឧបករណ៍ជាច្រើនដែលមានទំហំធំជាងមុននៅក្នុងក្រឡាក្បឿង បន្ទាប់មកលាយថ្នេរ។ ឧបករណ៍ដ៏អស្ចារ្យលាក់ព្រំដែនក្រឡាក្បឿង។ ឧបករណ៍ Meh បន្សល់ទុកស្នាមក្រឡាចត្រង្គស្រអាប់ៗ ប្រសិនបើអ្នកសម្លឹងមើល។ ហើយបាទ/ចាស៎ អ្នកនឹងសម្លឹងមើល ពីព្រោះមនុស្សចូលចិត្តពិនិត្យមើលភាពមិនល្អឥតខ្ចោះតូចតាចនៅការពង្រីក 300% ដូចជាសត្វ Gremlins តូចៗ 🧌


គ្រួសារគំរូសំខាន់ៗដែលប្រើសម្រាប់ការបង្កើនប្រសិទ្ធភាព AI (និងមូលហេតុដែលពួកគេមានអារម្មណ៍ខុសគ្នា) 🤖📚

១) គុណភាពបង្ហាញខ្ពស់ដែលមានមូលដ្ឋានលើ CNN (ជាឧបករណ៍បុរាណ)

បណ្តាញសរសៃប្រសាទ Convolutional គឺពូកែខាងលំនាំក្នុងស្រុក៖ គែម វាយនភាព រចនាសម្ព័ន្ធតូចៗ ( រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ដោយប្រើបណ្តាញ Convolutional ជ្រៅ (SRCNN) )។

  • គុណសម្បត្តិ៖ លឿន មានស្ថេរភាព មានការភ្ញាក់ផ្អើលតិចជាងមុន

  • គុណវិបត្តិ៖ អាចមើលទៅហាក់ដូចជា "ដំណើរការ" បន្តិចប្រសិនបើត្រូវបានរុញច្រានខ្លាំង

2) ការបង្កើនគុណភាពរូបភាពដោយផ្អែកលើ GAN (រចនាប័ទ្ម ESRGAN) 🎭

GANs (Generative Adversarial Networks) បណ្តុះបណ្តាលម៉ាស៊ីនភ្លើងឱ្យផលិតរូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ ដែលឧបករណ៍រើសអើងមិនអាចបែងចែកពីរូបភាពពិតបាន ( Generative Adversarial Networks )។

  • គុណសម្បត្តិ៖ ព័ត៌មានលម្អិតដ៏មុតស្រួច វាយនភាពគួរឱ្យចាប់អារម្មណ៍

  • ចំណុចអវិជ្ជមាន៖ អាចបង្កើតព័ត៌មានលម្អិតដែលមិនមាន - ពេលខ្លះខុស ពេលខ្លះចម្លែក ( SRGAN , ESRGAN )

GAN អាចផ្តល់ឱ្យអ្នកនូវភាពច្បាស់ដែលគួរឱ្យភ្ញាក់ផ្អើល។ វាក៏អាចផ្តល់ឱ្យអ្នកនូវចិញ្ចើមបន្ថែមផងដែរ។ ដូច្នេះ... ជ្រើសរើសការប្រយុទ្ធរបស់អ្នក 😬

៣) ការបង្កើនទំហំដោយផ្អែកលើការសាយភាយ (តួអក្សរជំនួសច្នៃប្រឌិត) 🌫️➡️🖼️

ម៉ូដែលសាយភាយកាត់បន្ថយសំឡេងរំខានមួយជំហានម្តងៗ ហើយអាចត្រូវបានណែនាំដើម្បីបង្កើតព័ត៌មានលម្អិតដែលមានគុណភាពបង្ហាញខ្ពស់ ( SR3 )។

  • គុណសម្បត្តិ៖ អាចពូកែខាងព័ត៌មានលម្អិតគួរឱ្យជឿជាក់ ជាពិសេសសម្រាប់ការងារច្នៃប្រឌិត

  • ចំណុចអវិជ្ជមាន៖ អាចរសាត់ចេញពីអត្តសញ្ញាណ/រចនាសម្ព័ន្ធដើម ប្រសិនបើការកំណត់មានលក្ខណៈឈ្លានពាន ( SR3 )

នេះជាកន្លែងដែល “ការបង្កើនគុណភាពរូបភាព” ចាប់ផ្តើមលាយឡំជាមួយ “ការស្រមើស្រមៃឡើងវិញ”។ ពេលខ្លះនោះជាអ្វីដែលអ្នកចង់បាន។ ពេលខ្លះវាមិនមែនទេ។.

៤) ការបង្កើនគុណភាពវីដេអូជាមួយនឹងភាពស៊ីសង្វាក់គ្នាតាមពេលវេលា 🎞️

ការបង្កើនគុណភាពវីដេអូជារឿយៗបន្ថែមតក្កវិជ្ជាដែលដឹងពីចលនា៖

  • ប្រើ​ស៊ុម​ជិត​គ្នា​ដើម្បី​ធ្វើ​ឱ្យ​លម្អិត​មាន​ស្ថេរភាព ( BasicVSR (CVPR 2021) )

  • ព្យាយាមជៀសវាងការភ្លឹបភ្លែតៗ និងវត្ថុបុរាណដែលវារ

  • ជារឿយៗផ្សំគុណភាពបង្ហាញខ្ពស់ជាមួយនឹង denoise និង deinterlacing ( វីដេអូ Topaz )

ប្រសិនបើការបង្កើនទំហំរូបភាពគឺដូចជាការស្ដារគំនូរមួយឡើងវិញ ការបង្កើនទំហំវីដេអូគឺដូចជាការស្ដារសៀវភៅត្រឡប់ឡើងវិញដោយមិនធ្វើឱ្យច្រមុះរបស់តួអង្គផ្លាស់ប្តូររូបរាងរាល់ទំព័រ។ ដែលវាពិបាកជាងវាស្តាប់ទៅទៅទៀត។.


ហេតុអ្វីបានជាការបង្កើនប្រសិទ្ធភាព AI ពេលខ្លះមើលទៅដូចជាក្លែងក្លាយ (និងរបៀបសម្គាល់វា) 👀🚩

ការបង្កើនគុណភាពរូបភាពដោយ AI បរាជ័យក្នុងវិធីដែលអាចសម្គាល់បាន។ នៅពេលដែលអ្នករៀនលំនាំទាំងនោះ អ្នកនឹងឃើញវាគ្រប់ទីកន្លែង ដូចជាការទិញឡានថ្មី ហើយស្រាប់តែសម្គាល់ឃើញម៉ូដែលនោះនៅគ្រប់ផ្លូវ 😵💫

ប្រជាប្រិយប្រាប់ថា៖

  • លាប​ក្រមួន ​លើ​ស្បែក​មុខ (បំបាត់​សំឡេង​រំខាន + ធ្វើ​ឲ្យ​រលោង​ពេក)

  • ហាឡូ​ដែល​មុត​ពេក ​ជុំវិញ​គែម (តំបន់ "ហួស​កម្រិត" បុរាណ) ( ការ​បញ្ចូល​ទ្វេ​ភាគី )

  • វាយនភាពដដែលៗ (ជញ្ជាំងឥដ្ឋក្លាយជាលំនាំចម្លង-បិទភ្ជាប់)

  • ភាពផ្ទុយគ្នាតូចៗដ៏ស្រួយៗ ដែលស្រែកថា "ក្បួនដោះស្រាយ"

  • អត្ថបទ​ខូច​ទ្រង់ទ្រាយ ​ដែល​អក្សរ​ក្លាយ​ជា​អក្សរ​ស្ទើរ​តែ​ទាំងស្រុង (ប្រភេទ​អាក្រក់​បំផុត)

  • ការរសាត់បាត់ព័ត៌មានលម្អិត ដែលលក្ខណៈពិសេសតូចៗផ្លាស់ប្តូរបន្តិចបន្តួច ជាពិសេសនៅក្នុងលំហូរការងារផ្សព្វផ្សាយ ( SR3 )

ផ្នែកដ៏លំបាក៖ ពេលខ្លះវត្ថុបុរាណទាំងនេះមើលទៅ "ល្អជាង" គ្រាន់តែក្រឡេកមើលមួយភ្លែត។ ខួរក្បាលរបស់អ្នកចូលចិត្តភាពមុតស្រួច។ ប៉ុន្តែបន្ទាប់ពីមួយសន្ទុះ វាមានអារម្មណ៍ថា... ខុស។.

យុទ្ធសាស្ត្រល្អមួយគឺត្រូវពង្រីក ហើយពិនិត្យមើលថាតើវាមើលទៅធម្មជាតិឬអត់នៅចម្ងាយមើលធម្មតា។ ប្រសិនបើវាមើលទៅល្អត្រឹមតែពង្រីក 400% នោះមិនមែនជាជ័យជម្នះទេ នោះជាចំណង់ចំណូលចិត្ត 😅


របៀបដែល AI Upscaling ដំណើរការ៖ ផ្នែកបណ្តុះបណ្តាល ដោយមិនមានបញ្ហាគណិតវិទ្យា 📉🙂

ការបណ្តុះបណ្តាលម៉ូដែលដែលមានគុណភាពបង្ហាញខ្ពស់ជាធម្មតាពាក់ព័ន្ធនឹង៖

ប្រភេទនៃការខាតបង់ធម្មតា៖

  • ការបាត់បង់ភីកសែល (L1/L2)
    លើកទឹកចិត្តឱ្យមានភាពត្រឹមត្រូវ។ អាចបង្កើតលទ្ធផលទន់បន្តិច។

  • ការបាត់បង់ការយល់ឃើញ
    ប្រៀបធៀបលក្ខណៈពិសេសដែលជ្រៅជាង (ដូចជា "តើវា មើលទៅ ស្រដៀងគ្នាទេ") ជាជាងភីកសែលពិតប្រាកដ ( ការបាត់បង់ការយល់ឃើញ (Johnson et al., 2016) )។

  • ការខាតបង់​ដោយ​គូប្រជែង (GAN)
    លើកទឹកចិត្ត​ឲ្យ​មាន​ភាពប្រាកដនិយម ជួនកាល​ដោយ​ខាតបង់​ភាពត្រឹមត្រូវ​តាម​ន័យត្រង់ ( SRGAN , Generative Adversarial Networks )។

មានការអូសទាញឥតឈប់ឈរ៖

  • ធ្វើឱ្យវា ស្មោះត្រង់ នឹងច្បាប់ដើម
    vs

  • ធ្វើឱ្យវា មើលទៅគួរឱ្យចាប់អារម្មណ៍

ឧបករណ៍ផ្សេងៗគ្នាស្ថិតនៅកន្លែងផ្សេងៗគ្នានៅលើវិសាលគមនោះ។ ហើយអ្នកប្រហែលជាចូលចិត្តមួយអាស្រ័យលើថាតើអ្នកកំពុងស្ដាររូបថតគ្រួសារឡើងវិញ ឬរៀបចំផ្ទាំងរូបភាពដែល "រូបរាងស្អាត" សំខាន់ជាងភាពត្រឹមត្រូវខាងកោសល្យវិច្ច័យ។.


លំហូរការងារជាក់ស្តែង៖ រូបថត ស្កែនចាស់ៗ អានីមេ និងវីដេអូ 📸🧾🎥

រូបថត (រូបបញ្ឈរ ទេសភាព រូបថតផលិតផល)

ការអនុវត្តល្អបំផុតជាធម្មតាគឺ៖

  • បន្ថយសំឡេងរំខានបន្តិចបន្តួចជាមុនសិន (បើចាំបាច់)

  • កម្រិតខ្ពស់ជាមួយនឹងការកំណត់អភិរក្ស

  • បន្ថែមគ្រាប់ធញ្ញជាតិមកវិញ ប្រសិនបើរបស់របរមានអារម្មណ៍ថារលោងពេក (មែនហើយ ពិតជាដូច្នោះមែន)

គ្រាប់ធញ្ញជាតិប្រៀបដូចជាអំបិល។ ច្រើនពេកអាចបំផ្លាញអាហារពេលល្ងាចបាន ប៉ុន្តែគ្មានអ្វីអាចធ្វើឲ្យមានរសជាតិរាបស្មើបន្តិចសោះឡើយ 🍟

ការស្កេនចាស់ៗ និងរូបភាពដែលបានបង្ហាប់យ៉ាងខ្លាំង

ទាំងនេះពិបាកជាង ពីព្រោះគំរូអាចចាត់ទុកប្លុកបង្ហាប់ជា "វាយនភាព"។
សាកល្បង៖

  • ការដកយក ឬ ការបំបាត់ចោលនូវវត្ថុបុរាណ

  • បន្ទាប់មកកម្រិតខ្ពស់

  • បន្ទាប់មក ការធ្វើឱ្យច្បាស់ស្រាលៗ (កុំច្រើនពេក... ខ្ញុំដឹង មនុស្សគ្រប់គ្នានិយាយបែបនោះ ប៉ុន្តែនៅតែ)

អានីមេ និង សិល្បៈបន្ទាត់

សិល្បៈបន្ទាត់ទទួលបានអត្ថប្រយោជន៍ពី៖

  • ម៉ូដែលដែលរក្សាគែមស្អាត

  • ការបំភាន់វាយនភាពដែលកាត់បន្ថយ ការបង្កើនទំហំ
    អានីមេជារឿយៗមើលទៅអស្ចារ្យព្រោះរូបរាងមានភាពសាមញ្ញ និងស៊ីសង្វាក់គ្នា។ (សំណាងណាស់)

វីដេអូ

វីដេអូបន្ថែមជំហានបន្ថែម៖

  • លុបបំបាត់សំឡេងរំខាន

  • ឌឺអ៊ីនធឺឡេស (សម្រាប់ប្រភពជាក់លាក់)

  • លំដាប់ខ្ពស់

  • ការធ្វើឱ្យរលោង ឬស្ថេរភាពតាមពេលវេលា ( BasicVSR (CVPR 2021) )

  • ការណែនាំគ្រាប់ធញ្ញជាតិឡើងវិញជាជម្រើសសម្រាប់ភាពស្អិតជាប់

ប្រសិនបើអ្នករំលងភាពស៊ីសង្វាក់គ្នាតាមពេលវេលា អ្នកនឹងទទួលបានព័ត៌មានលម្អិតភ្លឹបភ្លែតៗ។ នៅពេលដែលអ្នកសម្គាល់ឃើញវា អ្នកមិនអាចមើលវាចេញបានទេ។ ដូចជាកៅអីដែលមានសំឡេងគ្រហឹមៗនៅក្នុងបន្ទប់ស្ងាត់មួយ 😖


ការជ្រើសរើសការកំណត់ដោយមិនចាំបាច់ទាយច្រើនពេក (សន្លឹកបន្លំតូចមួយ) 🎛️😵💫

នេះជាផ្នត់គំនិតចាប់ផ្តើមដ៏ល្អមួយ៖

  • ប្រសិនបើមុខមើលទៅដូចប្លាស្ទិក
    សូមកាត់បន្ថយការបន្ថយសំឡេងរំខាន កាត់បន្ថយការធ្វើឱ្យច្បាស់ សូមសាកល្បងម៉ូដែល ឬរបៀបដែលថែរក្សាមុខ។

  • ប្រសិនបើវាយនភាពមើលទៅខ្លាំងពេក
    សូមបន្ថយគ្រាប់រំកិល “ការបង្កើនលម្អិត” ឬ “សង្គ្រោះព័ត៌មានលម្អិត” សូមបន្ថែមគ្រាប់ធញ្ញជាតិស្រាលៗបន្ទាប់ពីនោះ។

  • ប្រសិនបើគែមភ្លឺ
    សូមបន្ថយការធ្វើឱ្យច្បាស់ សូមពិនិត្យមើលជម្រើសទប់ស្កាត់ហាឡូ។

  • ប្រសិនបើរូបភាពមើលទៅហាក់ដូចជា "AI" ពេក
    ចូរប្រើវិធីអភិរក្សនិយមជាង។ ពេលខ្លះចលនាដ៏ល្អបំផុតគឺគ្រាន់តែ... តិចជាង។

ដូចគ្នានេះដែរ៖ កុំបង្កើនទំហំរូបភាព 8x គ្រាន់តែដោយសារតែអ្នកអាចធ្វើបាន។ 2x ឬ 4x ស្អាតជារឿយៗជាចំណុចល្អបំផុត។ ក្រៅពីនេះ អ្នកកំពុងសុំឱ្យម៉ូដែលសរសេររឿងប្រឌិតអំពីភីកសែលរបស់អ្នក 📖😂


សីលធម៌ ភាពត្រឹមត្រូវ និងសំណួរឆ្គងៗអំពី «សច្ចភាព» 🧭😬

ការបង្កើនទំហំ AI ធ្វើឱ្យបន្ទាត់មួយព្រិលៗ៖

  • ការស្ដារឡើងវិញមានន័យថា ការស្ដារឡើងវិញនូវអ្វីដែលមាន

  • ការបង្កើនប្រសិទ្ធភាពមានន័យថាបន្ថែមអ្វីដែលមិនមែន

ជាមួយរូបថតផ្ទាល់ខ្លួន ជាធម្មតាវាល្អ (និងស្រស់ស្អាត)។ ជាមួយសារព័ត៌មាន ភស្តុតាងផ្លូវច្បាប់ រូបភាពវេជ្ជសាស្ត្រ ឬអ្វីក៏ដោយដែលភាពស្មោះត្រង់មានសារៈសំខាន់... អ្នកត្រូវប្រុងប្រយ័ត្ន ( OSAC/NIST: មគ្គុទ្ទេសក៍ស្តង់ដារសម្រាប់ការគ្រប់គ្រងរូបភាពឌីជីថលកោសល្យវិច្ច័យ , គោលការណ៍ណែនាំ SWGDE សម្រាប់ការវិភាគរូបភាពកោសល្យវិច្ច័យ )។

ច្បាប់សាមញ្ញមួយ៖

  • ប្រសិនបើហានិភ័យខ្ពស់ សូមចាត់ទុកការបង្កើនទំហំ AI ជាឧទាហរណ៍ មិនមែន ជារឿងច្បាស់លាស់នោះទេ។

ម្យ៉ាងទៀត ការបង្ហាញព័ត៌មានក៏សំខាន់ផងដែរនៅក្នុងបរិបទវិជ្ជាជីវៈ។ មិនមែនដោយសារតែ AI ជាអំពើអាក្រក់នោះទេ ប៉ុន្តែដោយសារតែទស្សនិកជនសមនឹងទទួលបានព័ត៌មានថាតើព័ត៌មានលម្អិតត្រូវបានសាងសង់ឡើងវិញ ឬចាប់យកបានឬអត់។ នោះគ្រាន់តែជា… ការគោរព។.


កំណត់ចំណាំបិទបញ្ចប់ និងការសង្ខេបរហ័ស 🧡✅

ដូច្នេះ របៀបដែល AI Upscaling ដំណើរការ គឺ៖ ម៉ូដែលរៀនពីរបៀបដែលព័ត៌មានលម្អិតដែលមានគុណភាពបង្ហាញខ្ពស់ មានទំនោរ ទាក់ទងនឹងលំនាំដែលមានគុណភាពបង្ហាញទាប បន្ទាប់មកព្យាករណ៍ពីភីកសែលបន្ថែមដែលអាចទុកចិត្តបានក្នុងអំឡុងពេល upscaling ( ការរៀនសូត្រជ្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ )។ អាស្រ័យលើគ្រួសារម៉ូដែល (CNN, GAN, diffusion, video-temporal) ការព្យាករណ៍នោះអាចមានលក្ខណៈអភិរក្ស និងស្មោះត្រង់... ឬដិត និងពេលខ្លះមិនច្បាស់លាស់ 😅

សង្ខេប​រហ័ស

  • ការបង្កើនទំហំបែបប្រពៃណីលាតសន្ធឹងភីកសែល ( Bicubic interpolation )

  • ការបង្កើនគុណភាពរូបភាពដោយ AI ព្យាករណ៍ពីព័ត៌មានលម្អិតដែលបាត់ដោយប្រើលំនាំដែលបានរៀន ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) )

  • លទ្ធផលដ៏អស្ចារ្យកើតចេញពីគំរូត្រឹមត្រូវ + ការអត់ធ្មត់

  • សូមប្រយ័ត្នចំពោះហាឡូ ផ្ទៃដូចក្រមួន វាយនភាពដដែលៗ និងភ្លឹបភ្លែតៗនៅក្នុងវីដេអូ ( BasicVSR (CVPR 2021) )

  • ការបង្កើនគុណភាពរូបភាព (Upscaling) ជារឿយៗគឺជា "ការកសាងឡើងវិញដែលអាចទុកចិត្តបាន" មិនមែនជាការពិតដ៏ល្អឥតខ្ចោះនោះទេ ( SRGAN , ESRGAN )

ប្រសិនបើអ្នកចង់បាន សូមប្រាប់ខ្ញុំពីអ្វីដែលអ្នកកំពុងធ្វើឱ្យប្រសើរឡើង (មុខ រូបថតចាស់ៗ វីដេអូ គំនូរជីវចល ការស្កេនអក្សរ) ហើយខ្ញុំនឹងស្នើយុទ្ធសាស្ត្រកំណត់ដែលមានទំនោរគេចពីគ្រោះថ្នាក់ទូទៅនៃ "រូបរាង AI" 🎯🙂


សំណួរដែលសួរញឹកញាប់

ការបង្កើនប្រសិទ្ធភាព AI និងរបៀបដែលវាដំណើរការ

ការបង្កើនគុណភាពបង្ហាញរូបភាពដោយ AI (ជារឿយៗត្រូវបានគេហៅថា "super-resolution") បង្កើនគុណភាពបង្ហាញរូបភាពដោយព្យាករណ៍ពីព័ត៌មានលម្អិតដែលមានគុណភាពបង្ហាញខ្ពស់ដែលបាត់ពីលំនាំដែលបានរៀនក្នុងអំឡុងពេលហ្វឹកហាត់។ ជំនួសឱ្យការលាតសន្ធឹងភីកសែលដូចជាការបញ្ចូល bicubic គំរូសិក្សាពីគែម វាយនភាព ផ្ទៃ និងបន្ទាត់ដូចអក្សរ បន្ទាប់មកបង្កើតទិន្នន័យភីកសែលថ្មីដែលស្របនឹងលំនាំដែលបានរៀនទាំងនោះ។ វាមិនសូវ "ស្តារការពិតឡើងវិញ" ទេ ប៉ុន្តែ "ធ្វើការស្មានដែលអាចទុកចិត្តបាន" ដែលអានថាធម្មជាតិ។.

ការបង្កើនទំហំ AI ធៀបនឹងការប្តូរទំហំ bicubic ឬបែបប្រពៃណី

វិធីសាស្ត្រ​បង្កើន​គុណភាព​រូបភាព​បែប​ប្រពៃណី (ដូចជា bicubic) ភាគច្រើន​បញ្ចូល​គ្នា​រវាង​ភីកសែល​ដែល​មាន​ស្រាប់ ដោយ​ធ្វើ​ឲ្យ​ការ​ផ្លាស់ប្តូរ​រលូន​ដោយ​មិន​បង្កើត​ព័ត៌មាន​លម្អិត​ថ្មី​ពិតប្រាកដ។ ការបង្កើន​គុណភាព​រូបភាព​ដោយ AI មាន​គោលបំណង​កសាង​រចនាសម្ព័ន្ធ​ដែល​អាច​ជឿ​ទុកចិត្ត​ឡើងវិញ​ដោយ​ការ​សម្គាល់​សញ្ញា​ដែល​មើលឃើញ និង​ព្យាករណ៍​ពី​អ្វី​ដែល​កំណែ​ដែល​មាន​គុណភាព​បង្ហាញ​ខ្ពស់​នៃ​សញ្ញា​ទាំងនោះ​មាន​ទំនោរ​ទៅ​ជា​រូបរាង។ នោះហើយជាមូលហេតុដែលលទ្ធផល AI អាចមានអារម្មណ៍ច្បាស់ជាងមុន ហើយក៏ជាមូលហេតុដែលពួកគេអាចណែនាំវត្ថុបុរាណ ឬ "បង្កើត" ព័ត៌មានលម្អិតដែលមិនមាននៅក្នុងប្រភព។.

ហេតុអ្វីបានជាមុខអាចមើលទៅមានក្រមួន ឬរលោងពេក

មុខ​ដែល​មាន​សភាព​ដូច​ក្រមួន​ជាធម្មតា​កើតចេញពី​ការ​កាត់បន្ថយ​សំឡេង​រំខាន និង​ការ​ធ្វើឱ្យ​រលោង​យ៉ាង​ខ្លាំងក្លា រួមផ្សំ​ជាមួយ​នឹង​ការ​ធ្វើ​ឱ្យ​ច្បាស់​ដែល​លុប​ចេញ​នូវ​វាយនភាព​ស្បែក​ធម្មជាតិ។ ឧបករណ៍​ជាច្រើន​ព្យាបាល​សំឡេង​រំខាន និង​វាយនភាព​ល្អិតល្អន់​ដូចគ្នា ដូច្នេះ​ការ "សម្អាត" រូបភាព​អាច​លុប​រន្ធញើស និង​ព័ត៌មានលម្អិត​ស្រទន់។ វិធីសាស្រ្ត​ទូទៅ​មួយ​គឺ​កាត់បន្ថយ​ការ​កាត់បន្ថយ​សំឡេង​រំខាន និង​ការ​ធ្វើ​ឱ្យ​ច្បាស់ ប្រើ​របៀប​ថែរក្សា​មុខ​ប្រសិនបើ​មាន បន្ទាប់មក​បញ្ចូល​គ្រាប់​ធញ្ញជាតិ​ឡើងវិញ​ដើម្បី​ឱ្យ​លទ្ធផល​មើលទៅ​មិនសូវ​ប្លាស្ទិក និង​មាន​ភាព​ទាក់ទាញ​ជាង​មុន​។.

វត្ថុបុរាណ​បង្កើន​ទំហំ​ AI ទូទៅ​ដែល​ត្រូវ​តាមដាន

ការ​បង្ហាញ​ជា​ធម្មតា​រួម​មាន​រាង​ហាឡូ​ជុំវិញ​គែម លំនាំ​វាយនភាព​ដដែលៗ (ដូចជា​ឥដ្ឋ​ចម្លង​-​បិទភ្ជាប់) ភាព​ផ្ទុយ​គ្នា​តូចៗ​ស្រួយៗ និង​អក្សរ​ដែល​ប្រែ​ទៅ​ជា "ស្ទើរតែ​ជា​អក្សរ"។ នៅ​ក្នុង​លំហូរ​ការងារ​ដែល​ផ្អែក​លើ​ការ​សាយភាយ អ្នក​ក៏​អាច​មើល​ឃើញ​ការ​រសាត់​នៃ​ព័ត៌មាន​លម្អិត​ដែល​លក្ខណៈ​ពិសេស​តូចៗ​ផ្លាស់​ប្តូរ​យ៉ាង​ស្ទាត់ជំនាញ។ សម្រាប់​វីដេអូ ការ​ភ្លឹបភ្លែតៗ និង​ព័ត៌មាន​លម្អិត​វារ​ឆ្លងកាត់​ស៊ុម​គឺជា​សញ្ញា​ព្រមាន​ធំៗ។ ប្រសិនបើ​វា​មើល​ទៅ​ល្អ​តែ​នៅ​ពេល​ពង្រីក​ខ្លាំង​ពេក ការ​កំណត់​ប្រហែល​ជា​ឈ្លានពាន​ពេក។.

របៀបដែល GAN, CNN និង diffusion upscalers មានទំនោរខុសគ្នានៅក្នុងលទ្ធផល

គុណភាពបង្ហាញខ្ពស់ដែលមានមូលដ្ឋានលើ CNN មានទំនោរទៅរកភាពស្ថិតស្ថេរ និងអាចទស្សន៍ទាយបានច្រើនជាង ប៉ុន្តែវាអាចមើលទៅ "ដំណើរការ" ប្រសិនបើត្រូវបានជំរុញយ៉ាងខ្លាំង។ ជម្រើសដែលមានមូលដ្ឋានលើ GAN (រចនាប័ទ្ម ESRGAN) ជារឿយៗបង្កើតវាយនភាពដ៏មុតស្រួច និងភាពមុតស្រួចដែលយល់ឃើញ ប៉ុន្តែពួកវាអាចបំភាន់ព័ត៌មានលម្អិតមិនត្រឹមត្រូវ ជាពិសេសនៅលើផ្ទៃ។ ការបង្កើនមាត្រដ្ឋានដែលមានមូលដ្ឋានលើឌីហ្វ្លុយស៊ីសអាចបង្កើតព័ត៌មានលម្អិតដ៏ស្រស់ស្អាត និងសមហេតុផល ប៉ុន្តែវាអាចរសាត់ចេញពីរចនាសម្ព័ន្ធដើម ប្រសិនបើការកំណត់ការណែនាំ ឬកម្លាំងខ្លាំងពេក។.

យុទ្ធសាស្ត្រកំណត់ជាក់ស្តែងសម្រាប់ជៀសវាងរូបរាង "AI ពេក"

ចាប់ផ្តើមអភិរក្សនិយម៖ បង្កើនទំហំ 2× ឬ 4× មុនពេលឈានដល់កត្តាខ្លាំង។ ប្រសិនបើមុខមើលទៅដូចប្លាស្ទិក សូមបន្ថយសំឡេងរំខាន និងការធ្វើឱ្យច្បាស់ ហើយសាកល្បងរបៀបស្គាល់មុខ។ ប្រសិនបើវាយនភាពខ្លាំងពេក សូមបន្ថយការបង្កើនព័ត៌មានលម្អិត ហើយពិចារណាបន្ថែមគ្រាប់ធញ្ញជាតិបន្តិចបន្តួចបន្ទាប់ពីនោះ។ ប្រសិនបើគែមភ្លឺ សូមកាត់បន្ថយការធ្វើឱ្យច្បាស់ ហើយពិនិត្យមើលការបង្ក្រាបហាឡូ ឬវត្ថុបុរាណ។ នៅក្នុងបំពង់ជាច្រើន "តិច" ឈ្នះព្រោះវារក្សាភាពប្រាកដនិយមដែលអាចទុកចិត្តបាន។.

ការដោះស្រាយរូបភាពស្កេនចាស់ៗ ឬរូបភាពដែលបានបង្ហាប់ JPEG យ៉ាងច្រើនមុនពេលបង្កើនទំហំ

រូបភាពដែលបានបង្ហាប់គឺពិបាកណាស់ ពីព្រោះម៉ូដែលអាចចាត់ទុកវត្ថុបុរាណនៃប្លុកជាវាយនភាពពិត ហើយពង្រីកវា។ លំហូរការងារទូទៅមួយគឺការដកយកវត្ថុបុរាណចេញ ឬការបំបាត់ការរារាំងជាមុនសិន បន្ទាប់មកការបង្កើនទំហំ បន្ទាប់មកការធ្វើឱ្យច្បាស់ស្រាលៗ លុះត្រាតែចាំបាច់។ សម្រាប់ការស្កេន ការសម្អាតថ្នមៗអាចជួយម៉ូដែលផ្តោតលើរចនាសម្ព័ន្ធពិតប្រាកដជាជាងការខូចខាត។ គោលដៅគឺដើម្បីកាត់បន្ថយ "សញ្ញាវាយនភាពក្លែងក្លាយ" ដូច្នេះឧបករណ៍បង្កើនទំហំមិនត្រូវបានបង្ខំឱ្យធ្វើការស្មានដោយទំនុកចិត្តពីការបញ្ចូលសំឡេងរំខាននោះទេ។.

ហេតុអ្វីបានជាការបង្កើនគុណភាពវីដេអូពិបាកជាងការបង្កើនគុណភាពរូបថត

ការបង្កើនគុណភាពវីដេអូត្រូវតែស៊ីសង្វាក់គ្នានៅទូទាំងស៊ុម មិនមែនគ្រាន់តែល្អនៅលើរូបភាពមួយនោះទេ។ ប្រសិនបើព័ត៌មានលម្អិតភ្លឹបភ្លែតៗពីស៊ុមមួយទៅស៊ុមមួយ លទ្ធផលនឹងក្លាយទៅជារំខានយ៉ាងឆាប់រហ័ស។ វិធីសាស្រ្តផ្តោតលើវីដេអូប្រើព័ត៌មានបណ្ដោះអាសន្នពីស៊ុមជិតខាងដើម្បីធ្វើឱ្យការកសាងឡើងវិញមានស្ថេរភាព និងជៀសវាងវត្ថុបុរាណដែលភ្លឺចែងចាំង។ លំហូរការងារជាច្រើនក៏រួមបញ្ចូល denoise, deinterlacing សម្រាប់ប្រភពជាក់លាក់ និងការណែនាំឡើងវិញនូវគ្រាប់ធញ្ញជាតិជាជម្រើស ដូច្នេះលំដាប់ទាំងមូលមានអារម្មណ៍ស៊ីសង្វាក់គ្នាជាជាងភាពមុតស្រួចសិប្បនិម្មិត។.

នៅពេលដែលការបង្កើនប្រសិទ្ធភាព AI មិនសមរម្យ ឬមានហានិភ័យក្នុងការពឹងផ្អែក

ការបង្កើនប្រសិទ្ធភាព AI ត្រូវបានចាត់ទុកថាជាការបង្កើនប្រសិទ្ធភាព មិនមែនជាភស្តុតាងទេ។ នៅក្នុងបរិបទដែលមានហានិភ័យខ្ពស់ដូចជា សារព័ត៌មាន ភស្តុតាងផ្លូវច្បាប់ រូបភាពវេជ្ជសាស្ត្រ ឬការងារកោសល្យវិច្ច័យ ការបង្កើតភីកសែល "គួរឱ្យជឿជាក់" អាចនាំឱ្យយល់ច្រឡំ ព្រោះវាអាចបន្ថែមព័ត៌មានលម្អិតដែលមិនត្រូវបានចាប់យក។ ការកំណត់ដែលមានសុវត្ថិភាពជាងគឺការប្រើប្រាស់វាដោយបង្ហាញជាឧទាហរណ៍ និងបង្ហាញថាដំណើរការ AI បានបង្កើតព័ត៌មានលម្អិតឡើងវិញ។ ប្រសិនបើភាពស្មោះត្រង់គឺមានសារៈសំខាន់ សូមរក្សាឯកសារដើម និងកត់ត្រាជំហានដំណើរការ និងការកំណត់នីមួយៗ។.

ឯកសារយោង

  1. arXiv - ការរៀនសូត្រស៊ីជម្រៅសម្រាប់រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់៖ ការស្ទង់មតិ - arxiv.org

  2. arXiv - រូបភាពដែលមានគុណភាពបង្ហាញខ្ពស់ដោយប្រើបណ្តាញ Deep Convolutional (SRCNN) - arxiv.org

  3. arXiv - Real-ESRGAN - arxiv.org

  4. arXiv - ESRGAN - arxiv.org

  5. arXiv - SR3 - arxiv.org

  6. អ្នកអភិវឌ្ឍន៍ NVIDIA - NVIDIA DLSS - developer.nvidia.com

  7. AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com

  8. ការចូលប្រើប្រាស់ដោយសេរីរបស់មូលនិធិចក្ខុវិស័យកុំព្យូទ័រ (CVF) - BasicVSR៖ ការស្វែងរកសមាសធាតុសំខាន់ៗនៅក្នុងវីដេអូដែលមានគុណភាពបង្ហាញខ្ពស់ (CVPR 2021) - openaccess.thecvf.com

  9. arXiv - បណ្តាញប្រឆាំងបង្កើត - arxiv.org

  10. arXiv - SRGAN - arxiv.org

  11. arXiv - ការបាត់បង់ការយល់ឃើញ (Johnson et al., 2016) - arxiv.org

  12. GitHub - ឃ្លាំង Real-ESRGAN (ជម្រើសក្រឡាក្បឿង) - github.com

  13. វិគីភីឌា - ការបញ្ចូលប៊ីគុប៊ីក - wikipedia.org

  14. មន្ទីរពិសោធន៍ Topaz - រូបថត Topaz - topazlabs.com

  15. មន្ទីរពិសោធន៍ Topaz - វីដេអូ Topaz - topazlabs.com

  16. មជ្ឈមណ្ឌលជំនួយ Adobe - Adobe Enhance > គុណភាពបង្ហាញខ្ពស់ - helpx.adobe.com

  17. NIST / OSAC - មគ្គុទ្ទេសក៍ស្តង់ដារសម្រាប់ការគ្រប់គ្រងរូបភាពឌីជីថលកោសល្យវិច្ច័យ (កំណែ 1.0) - nist.gov

  18. SWGDE - គោលការណ៍ណែនាំសម្រាប់ការវិភាគរូបភាពកោសល្យវិច្ច័យ - swgde.org

ស្វែងរក AI ចុងក្រោយបំផុតនៅហាងជំនួយការ AI ផ្លូវការ

អំពីយើង

ត្រឡប់ទៅប្លុកវិញ