Generovanie obrazov pomocou AI

Generatívne modely umožňujú vytvárať obrazy na základe textových zadaní (tzv. promptov), obrázkov alebo iných vstupov. Užívateľ napríklad textovo popíše svoju predstavu a AI následne vytvorí zodpovedajúci obraz. V súčasnosti sa najčastejšie využívajú predovšetkým difúzne modely, ktoré dominujú moderným nástrojom na generovanie obrazov.

Difúzne modely
Difúzne modely fungujú tak, že sa počas tréningu do obrázkov postupne pridáva šum a model sa učí tento šum odstraňovať. Pri generovaní nového obrazu potom AI postupne „čistí“ náhodný šum, až kým z neho nevytvorí výsledný obraz zodpovedajúci zadaniu užívateľa.

GAN — Generatívne adverzariálne siete
Siete GAN využívajú dve neurónové siete — generátor a diskriminátor. Generátor vytvára nové obrazy a diskriminátor hodnotí, či vyzerajú realisticky. Obe siete sa spoločne učia a postupne sa zlepšujú. Siete GAN boli veľmi dôležité pre rozvoj generatívnej AI, dnes sa však na bežné generovanie obrazov používajú menej často ako difúzne modely.

Moderná generatívna AI dnes často kombinuje viacero technológií a umožňuje nielen vytváranie nových obrazov, ale aj ich úpravy, štylizáciu, dopĺňanie chýbajúcich častí alebo generovanie videa.