Menü

Az öt legjobb ingyenes AI képgenerátor – a Punkt tesztje

24 • 05 • 05Kéri Gáspár

A Punkt időről-időre foglalkozik a mesterséges intelligencia (AI) jelenlétével a vizuális művészetekben, mindenekelőtt a fotográfia területére fókuszálva. Szemlézzük a jelenséggel kapcsolatos pro és kontra véleményeket, bemutatjuk a technológia fejlődésének állomásait, de megvilágítjuk az új médiummal kapcsolatban felmerülő társadalmi és etikai kérdéseket is. Ezúttal új területre léptünk, hogy egy teszt segítségével vizsgáljuk meg, hogy jelenleg mire képesek a mindenki számára elérhető AI képgenerátorok.

Tesztünk ötletét az új és feltörekvő technológiákkal foglalkozó online médium, a ReadWrite egyik cikke adta. Ahhoz, hogy mesterséges intelligenciával képeket generáljunk, utasításokat, promptokat kell adni az adott program számára, jellemzően angolul. És minél részletesebb, vagy ha úgy tetszik, határozottabb promptokat írunk, a végeredmény annál inkább tükrözi saját elképzeléseinket. Határt egyfelől saját gondolataink, koncepciónk átgondoltsága, hovatovább kreativitásunk, tudásunk és vizuális műveltségünk szabhat, másrészt az adott program képességei. Jelen tesztben arra törekedtünk, hogy a promptnak legyen hazai, illetve fotótörténeti vonatkozása. Végül némi kísérletezés után – nem túlbonyolítva az egyébként határozott utasításokat tartalmazó szöveget – az eredetileg angolul írt prompt így szólt mind az öt program számára:

„Készíts egy fekete-fehér fotográfiát André Kertész stílusában. Nyári eső után kisüt a nap Budapest felett. A kihalt belvárosban vagyunk, az előtérben egy férfi halad el biciklivel a Nagymező utcában.”

A tesztben szándékosan nem törtünk nagy babérokra; nem akartunk sem autonóm alkotásokat létrehozni, sem megkísérelni a valóság reprodukálását, ám ennek ellenére, vagy éppen ezért, nem egy esetben izgalmas és tanulságos végeredményt kaptunk. Például nem feltétlenül az öt közül legfejlettebbnek gondolt képgenerátorral értük el a legjobb eredményt. Bizonyos esetekben pedig azt is megtapasztaltuk, hogy egy adott program vizuális világát nem is olyan egyszerű saját ízlésünk, illetve elképzeléseink szerint alakítani. Emellett, mivel ingyenesen is igénybevehető képgenerátorokról van szó, az AI gyermekbetegségei és anomáliái bizonyos részletek pontatlanságában – például az arcok, a végtagok, az épületrészletek vagy a bicikli esetében – számos képen egyértelműen kiütköznek. Ugyanakkor azt is tudni kell, hogy bizonyos programok alkalmasak a korrekcióra, az egyes képeken történő további alakításra – főként, ha igénybe vesszük fizetős szolgáltatásaikat –, ám ezt most szándékosan elkerültük a könnyebb összehasonlíthatóság érdekében. Egy azonban általánosságban elmondható: kevesebb, vagy éppen több sikerrel mind Budapest belvárosának dualizmus korában kialakult építészeti arculata ugyanúgy megjelenik a generatív képeken, mint André Kertész két háború közötti fotográfiáinak atmoszférája.

Az öt AI képgenerátor közül a DeepAi rendelkezik az egyik legegyszerűbb felülettel, egyszerre pedig csak egyetlen képet hoz létre, ám azt sem a legpontosabban. Viszont az utasítások bővítésével tudjuk növelni hatékonyságát, sőt a képminőséget is, amennyiben előre meghatározott képstílusait használjuk, vagy egyenesen megrendeljük egyetlen fizetős csomagját. Az általunk írt promptra egyébként minden pontatlansága ellenére néhány meglepően erős hangulatú és releváns képet generált.

0103

DeepAi által generálta: Kéri Gáspár

0103

DeepAi által generálta: Kéri Gáspár

0103

DeepAi által generálta: Kéri Gáspár

0103

DeepAi által generálta: Kéri Gáspár

A regisztrációt igénylő Ideogram közösségi médiaként is működik, és a tesztelt programok közül kiemelkedik valódi fotográfiákat megközelítő képminőségével. Naponta legfeljebb huszonöt promptig használható ingyenesen, és egyszerre négy képet generál, amelyek tovább alakíthatók. Sőt, magic prompt szolgáltatásával utasításaink bővítéséhez is ad ötleteket. Ugyanakkor ez volt az a program, amit első körben a legkevésbé lehetett kreatívan, saját igényeink szerint utasítani. Sem a korra, sem Kertész stílusára nem talált rá, a pesti belvárost pedig kizárólag széles utcák hálójaként értelmezte, ráadásul minden képet szimmetrikusra komponált.

0103

Ideogram által generálta: Kéri Gáspár

0103

Ideogram által generálta: Kéri Gáspár

0103

Ideogram által generálta: Kéri Gáspár

0103

Ideogram által generálta: Kéri Gáspár

Elsőre talán a leggyengébb játékosnak a NightCafé tűnik, legalábbis amíg ingyenesen használjuk. Azt követően valamelyest megnyílnak a lehetőségek mindenféle stílus megválasztásához, sőt, a program akár egy alaknak is arcot tud generálni, de különféle művészettörténeti és műfaji stílusokban is dolgozhatunk vele. Mi természetesen most az ingyenes verziót teszteltük, amelyben megválaszthatjuk, hogy egyszerre hány képet generáljon le napi öt ingyenes prompt megadásáig. Ugyanakkor azt tapasztaltuk, hogy az ingyenes verzió, az égbekiáltó pontatlanságok ellenére is intelligensen dolgozott a megadott paraméterekkel.

0103

NightCafé által generálta: Kéri Gáspár

0103

NightCafé által generálta: Kéri Gáspár

0103

NightCafé által generálta: Kéri Gáspár

0103

NightCafé által generálta: Kéri Gáspár

A Dall-E támogatásával működő Microsoft Designer teljes egészében ingyenesen vehető igénybe, csak be kell hozzá lépni egy személyes Microsoft-fiókkal. Számtalan stílus közül választhatunk, ugyanakkor nincs szerkesztési lehetőségünk, de a promptok megírásához bőséges útmutatást ad. A generált képek kis hibahatáron mozognak és látványos eredményeket hoznak, ugyanakkor sehogyan sem tudtunk a mai hollywoodi rajzfilmstúdiók látványvilágára hajazó retró atmoszféra helyett André Kertész fotográfiáira utaló hatásokat kihozni.

0103

Microsoft Designer által generálta: Kéri Gáspár

0103

Microsoft Designer által generálta: Kéri Gáspár

0103

Microsoft Designer által generálta: Kéri Gáspár

0103

Microsoft Designer által generálta: Kéri Gáspár

Tapasztalatunk szerint az öt képgenerátor közül az ugyancsak regisztrációt igénylő RunwayAI volt leginkább alkalmas a kreatív munkára, még akkor is, ha pontatlanságai sok helyen szembetűnőek. Ám ezeknek a hibáknak jelentős része a további munka során korrigálható. Összetett felhasználói felülettel rendelkezik, sőt speciális esetekben kódolást igényel a munka, az ingyenes verzióval pedig mintegy száz képet tudunk egymást követően generálni. Szembetűnő volt ugyanakkor, hogy mennyire kreatívan értelmezte a számára megadott promptot, és mind a kompozíciókban, mint a témaválasztásokban tág értelmezési kerettel dolgozott Kertész vélt vagy valós stílusában. Sőt a képek egy része vintage nagyításokra emlékeztetve igyekszik megidézni az 1920-as, 1930-as évek fotográfiáinak matériáját.

0103

RunwayAI által generálta: Kéri Gáspár

0103

RunwayAI által generálta: Kéri Gáspár

0103

RunwayAI által generálta: Kéri Gáspár

0103

RunwayAI által generálta: Kéri Gáspár

Amint az kiderülhetett a tesztből, nem a professzionálisan dolgozó és alkotó promptográfusok nyomába eredtünk, hanem a mindenki számára elérhető AI képgenerátorok közül ötnek az elsődleges lehetőségeit és képességeit vizsgáltuk, fotótörténeti referenciát alkalmazva. Az eredmény számos tanulsággal szolgált számunkra, és annál is több gondolatot ébresztett bennünk azzal kapcsolatban, hogy jelenleg hol tart az a hónapról hónapra fejlődő technológia, amit egyesek átoknak, mások áldásnak tartanak.

Jegyzetek

A munka és szórakozás érdekes összekapcsolásának tekinthetjük Matt Growcoot újságíró kísérletét, aki minden idők leghíresebb és legünnepeltebb fotóit alkotta újra AI képgenerátorok segítségével. Ezeket a képeket egy korábbi cikkünkben mutattuk be.