Root NationNaujienosIT naujienosKaip filmuose: naujasis „Google“ nuotraukų apdorojimo AI paverčia jų mastelį ir tobulinimą realybe

Kaip filmuose: naujasis „Google“ nuotraukų apdorojimo AI paverčia jų mastelį ir tobulinimą realybe

-

Tikriausiai esate matę fantastinius filmus ar televizijos laidas, kur pagrindinis veikėjas prašo padidinti vaizdą ir pagerinti rezultatą – parodyti veidą, ar valstybinį numerį, ar kokią kitą esminę detalę. Naujausios „Google“ dirbtinio intelekto (AI) sistemos, pagrįstos vadinamuoju difuzijos modeliai, gali atlikti šį triuką.

Tai sudėtingas procesas, nes jį iš esmės prideda detalės į vaizdą, kurio fotoaparatas iš pradžių neužfiksavo, naudojant ypač protingus spėjimus, pagrįstus kitais panašiais vaizdais.

"Google"

„Google“ ši technika vadinama natūralia vaizdo sinteze, o šiuo konkrečiu atveju – itin aukšta vaizdo raiška. Pradedate nuo mažos nuotraukos su pikseliais ir baigiate kažkuo ryškiu, aišku ir natūralu. Jis gali būti ne visai originalus, bet pakankamai arti, kad žmogaus akiai atrodytų tikras.

Šiam darbui „Google“ pristatė du naujus AI įrankius. Pirmasis vadinamas SR3 arba Super-Resolution per pakartotinį patobulinimą, ir jis veikia pridėdamas vaizdo triukšmo ir jį pašalindamas. Atlikdamas daugybę tikimybių skaičiavimų, pagrįstų didele vaizdų duomenų baze ir tam tikra mašininio mokymosi magija, SR3 gali įsivaizduoti, kaip atrodo itin didelės raiškos mažos raiškos pikselių vaizdo versija.

Antrasis įrankis yra CDM arba kaskadiniai difuzijos modeliai. „Google“ juos apibūdina kaip „vamzdynus“, kuriais difuzijos modeliai, įskaitant SR3, gali būti nukreipti aukštos kokybės vaizdo mastelio keitimui. Paima tobulinimo modelius ir paverčia juos didesniais vaizdais.

"Google"

„Google“ teigimu, naudojant skirtingus patobulinimo modelius skirtingomis raiškomis, CDM metodas gali pranokti alternatyvius vaizdo padidinimo metodus. Naujasis dirbtinio intelekto variklis buvo išbandytas „ImageNet“ – milžiniškoje mokomųjų vaizdų, dažniausiai naudojamų vizualinio objekto atpažinimo tyrimams, duomenų bazėje.

Galutiniai SR3 ir CDM rezultatai yra įspūdingi. Atliekant standartinį testą, kuriame dalyvavo 50 savanorių, SR3 sukurti žmonių veidų vaizdai buvo supainioti su tikromis nuotraukomis maždaug 50 % atvejų – ir turint omenyje, kad idealus algoritmas turėtų pasiekti 50 %, tai įspūdinga. Verta pakartoti, kad šie patobulinti vaizdai nėra tikslūs originalų atitikmenys, tai yra kruopščiai apskaičiuoti modeliai, pagrįsti tikimybių matematika.

"Google"

„Google“ žada daug daugiau iš savo naujų AI variklių ir susijusių technologijų – ne tik veidų ir kitų gamtos objektų vaizdų papildymo, bet ir kitose tikimybinio modeliavimo srityse.

Taip pat skaitykite:

Registruotis
Pranešti apie
svečias

0 komentarai
Įterptieji atsiliepimai
Žiūrėti visus komentarus