Az öt legjobb ingyenes AI képgenerátor 2025-ben – A Punkt második tesztje
25 • 06 • 08Kéri Gáspár
Tavaly májusban megjelent cikkünkben öt népszerű ingyenes vagy ingyenesen is használható AI képgenerátort teszteltünk a Punkton. Azóta eltelt egy év, és az AI képalkotás robbanásszerű fejlődésen ment keresztül, de a folyamatnak messze nem látjuk még a végét. Új nevek kerültek a figyelem középpontjába, régiek bővítették szolgáltatásaikat, a képminőség pedig mára a fotográfia határait feszegeti. Ebben a cikkben összevetünk újabb öt ingyenesen is elérhető AI képgenerátort, hogy megnézzük, mire képesek a programok 2025-ben. Cikkünk konkluziójában ugyanakkor nem feledkezünk el azokról a szerzői jogi, etikai és autonóm alkotói kérdésekről, valamint problémákról sem, melyek időről-időre előkerülnek az AI képalkotás és a fotográfia parallel létezése kapcsán.
Az AI képgenerátorok fejlődésére az elmúlt tizenkét hónapban a technológiai szcéna egyik leglátványosabb történeteként tekinthetünk. Míg tavaly még gyakoriak voltak a torz kezek, szürreális fényviszonyok és túlzottan steril felületek, ma már a vezető rendszerek képesek hiteles perspektívát, természetes fényt, sőt stílustörténeti jellemzőket is reprodukálni. A kérdés ma már nem az, hogy lehet-e releváns képet generálni, hanem az, hogy mire és hogyan használjuk ezeket az eszközöket, illetve a végeredmény esetenként milyen etikai kérdésekkel és jogi problémákkal jár. Tavalyi gyakorlatunkhoz hasonlóan most sem csupán rendszereket teszteltünk, hanem egységes képalkotási koncepciót is. Mind az öt programot arra kértük, hogy hozzon létre egy képet André Kertész 1920-as évekbeli gyakorlatát idézve. A prompt a következő volt:
A solitary man sitting on a bench in a quiet urban park, early morning light. Black and white photograph that looks like it was taken by André Kertész in the 1920s. Strong composition, slightly high angle. Shot in 3:2 landscape aspect ratio, Leica 24x36mm format. Film grain, soft contrast, subtle imperfections, analog texture. (Egy magányos férfi ül egy padon egy csendes városi parkban, kora reggeli fényben. Fekete-fehér fénykép, amely olyan hatást kelt, mintha André Kertész készítette volna az 1920-as években. Erőteljes kompozíció, enyhén magas nézőpontból. 3:2 fekvő képarányban készült, Leica 24x36 mm-es formátumban. Filmszemcsés, lágy kontrasztú, finom hibákkal és analóg textúrával.)
A könnyebb összehasonlíthatóság érdekében idén is Kertész látásmódjához nyúltunk, a prompt pedig segített egységes stílusban tesztelni az idén kiválasztott öt program – Adobe Firefly, Tengr.ai, Getimg.ai, Deep Dream Generator, DALL·E 3 – hatékonyságát. Fontos ugyanakkor leszögezni, hogy most is kizárólag ingyenes vagy ingyenesen is használható képgenerátorokat teszteltünk, melyek jelentős részének fizetős verziója jócskán bővíti a képalkotás lehetőségeit, így a végeredményben is minőségbeli ugrást képes eredményezni.
Az Adobe saját fejlesztésű programja, az Adobe Firefly azok számára már ismerős lehet, akik eleve Adobe-felhasználók, és a képgenerálást szorosan integrálják a meglévő munkafolyamataikba, például Photoshop használata esetén. A Firefly kiemelkedik abban, hogy kizárólag jogtiszta adatbázison tanul, és remekül értelmezi a pontos tervezői promptokat. A havonta mindössze néhány kredites generálást lehetővé tevő ingyenes változat nagyon limitált, ennek dacára a teszt számára készült néhány kép meglepő hatékonysággal és változatosan értelmezte a Kertész stílusát kérő utasítást.
A teszt mezőnyének magyar versenyzője az a Tengr.ai, amely hazai cégként nemzetközi összehasonlításban is figyelemre méltó teljesítményre képes. Sajátossága a programnak az ún. emotional input, amely azt jelenti, hogy a képgenerálás során nemcsak a képi tartalmat, hanem annak hangulatát is megadhatjuk, amit a rendszer célirányos vizuális stílusban, tónusvilágban és kompozícióban is igyekszik megjeleníteni. Bár a tesztelt képgenerátorok minél pontosabb összehasonlíthatósága érdekében nem módosítottuk a promptot, a Tengr.ai ingyenes verziója így is meglepően kreatívan értelmezte Kertész világának atmoszféráját. Ráadásul itt még arra is volt lehetőségünk, hogy a program által felajánlott felső kameraállást is kipróbáljuk.
Annak dacára próbáltuk ki az AI képgenerátorok között kifejezetten erős szereplőnek számító Getimg.ai ingyenes verzióját, hogy a program főként – bár nem kizárólag – fotorealisztikus portrék és tárgyábrázolások előállítására tűnik a legalkalmasabbnak. Ezzel együtt a kora reggeli városi park atmoszféráját rendkívül hatékonyan állította elő, és láthatóan az anatómiai pontosságot is egészen jól megugrotta. Ugyanakkor a kompozíciót és a beállítás variációs lehetőségeit nem gondolta túl, de feltűnő a képek túlzott sterilitása is, ahogy bizonyos tárgyi elemek sem a két háború közötti korszak tárgykultúráját, hanem a jelent idézik meg. Természetesen, ha a napi limitált képszámmal működő ingyenes verziót fizetősre cserélnénk, a lehetőségeink itt is megugranának.
A Deep Dreem Generator az AI képgenerálás eddigi történetének egyik veteránja. Főként pszichedelikus, álomszerű képek és festményszerű effektek előállítására szokás használni, ennek megfelelően nem áll távol vizuáljától a giccs fogalma, bár ez egy másik cikk témája lehetne. Ugyanakkor éppen ezért volt érdekes és meglepő a Kertész nyomán megírt prompt alkalmazása, amely meglepően jó eredményt hozott. Ehhez persze hozzátartozik, hogy lehetőség van referenciaképek feltöltésére, ezzel pedig mi is éltünk egy Párizsban készült, kevésbé ismert Kertész-fotográfia alkalmazásával. A végeredményben ugyan felfedezhetünk anatómiai pontatlanságokat, ám a jellegzetes miliőt így is meglepően jól reprodukálta a program.
Tesztünk egyértelmű győztese megdöbbentően jó eredményeket hozott, messze elrugaszkodva a mezőny másik négy versenyzőjétől. A DALL·E 3 integrációja a ChatGPT-vel az eddig tárgyalt programoktól eltérő munkamódszert kínál például azzal, hogy nincs semmiféle kezelőfelület. A felhasználó természetes nyelven kommunikál a képgeneráló AI-jal, amely nemcsak képet készít, hanem vissza is kérdez, javít, vagy új változatot ajánl. A promptértelmezés pedig mindenképp a legerősebbnek számít ebben a mezőnyben. Bár fizetősre váltva itt is jelentősen nő a hatékonyság, ám még az ingyenes verzió esetében is meglepően jó eredmények születtek. Számos esetben nemcsak az analóg médium jellegzetességeit idézte meg a program, de még a mélységélesség, vagy az optikai leképezés egyéb sajátosságait is élethűen jelenítette meg; az emberi alakok anatómiai pontosságáról és részletgazdagságáról nem is beszélve.
Bármilyen kifinomult is az algoritmus, a promptot mindig az ember írja. Egyre több vizuális alkotó használja tudatosan az AI képgenerátorokat, s ezzel megjelenik egy új kérdés is: a promptográfus felelőssége. És hogy mit jelent ez a gyakorlatban? Egyfelől tisztában kell lenni a kép eredetével. Amennyiben egy generatív kép olyan hatást kelt, mintha mondjuk vintage fotográfia lenne, akkor ezt jelezni kell. Emellett meg kell nevezni a szerepeket is. Ha egy kép AI által generált, az nem kisebbíti a promptoló érdemét, ám lényeges, hogy ne keverjük össze az ember és a gép alkotói szerepét. Mindezek mellett egy alkotói szándékokkal megírt prompt nem pusztán parancs, hanem egyre inkább alkotói gesztus kérdése. Egy vizuális alkotó hitelessége ugyancsak bizalom kérdése. Ha egy AI modell olyan képet generál, amely majdhogynem felismerhetően hasonlít egy klasszikus vagy akár művész képalkotó gyakorlatára, ott felmerülhet – ha nem is jogi, de etikai értelemben – a plágium kérdése. Nem véletlen, hogy mi sem titkoltuk el, hogy tesztünkhöz André Kertész világát hívtuk segítségül. És ami talán a legfontosabb a fotorealisztikus generatív képek kapcsán, hogy egyértelmű határvonalat kell húzni a promptográfia és a fotográfia között.
A 2024-es AI képgeneráló-tesztünk ezen a linken található.