Menü

A mesterséges intelligencia forradalma a fotográfiában – Barát vagy ellenség?

25 • 09 • 07Szabó Benedek

A mesterséges képgeneráló eljárások kapcsán gyakran felmerül az a kérdés, hogy mennyire lehet az MI által készített képeket fényképként kezelni vagy megközelíteni. Ezeknek a generált képeknek gyakran tapasztalható sajátossága, hogy a fénykép vizualitásának másolására törekednek. A mesterséges képeken megjelenő kompozíciók a szín- és látványvilág, illetve grafikai megvalósítottságuk miatt valóban közelebb állnak a fényképeken megszokott vizualitáshoz, a szemlélőnek azonban több lényeges különbségre érdemes ébernek maradnia. Az egyik ilyen differencia abból a magától értetődőnek tűnő tényből adódik, hogy a mesterséges kép nem a külvilág látványát rögzíti, hanem algoritmusok által kreál látványokat.[1]

Ebből következik az is, hogy a fénykép szemlélésének más minőségei lehetségesek. A fényképelméletek gyakran kiemelik, hogy a fénykép valódi ereje – és egyedülállósága a képek családjában – abban keresendő, hogy az általa megjelenített látvánnyal valóban találkozott. Amíg egy festmény vagy grafika előállítása nem kötött az általuk ábrázolt látványhoz, azoktól függetlenül is képes megmutatni, addig a fényképet készítő eszköznek valóban jelen kell lennie. A hagyományos, filmalapú fotográfiánál ez fokozottan igaz. Ott a film valóban ,,láthatta” a látványt, amelyet megörökít, így sokkal közelebbi viszonyban áll az ábrázolás tárgyával: a kész kép és a kép tárgyának kapcsolatában ebben lehet a legjobban felmutatni, mivel a fénykép azért lehet a múlt emlékeinek megragadója, mivel referensével – az általa ábrázolt látvánnyal – valós viszonya van, ez a referens pedig mindig különbözik. Az objektív előtt szükségszerűen jelen kell lennie annak, amit azután a fénykép felülete megjelenít, enélkül nem lehetséges fényalapú ábrázolás.[2]

Egyes művészetfilozófiai elméletek ezt olyan intakt rögzítésként értelmezik, amelyet a halotti maszkéhoz lehet hasonlítani. Az összehasonlítás abból a szempontból biztosan megállja a helyét, hogy a maszk készítése szintén egy negatív lenyomattal indul, a maszkot kiöntve kapható meg a ,,pozitív” forma.[3] Ez tehát könnyen megfeleltethető annak a metódusnak, amely során a filmnegatívot pozitívba fordítva kapjuk meg a rögzített látványt. A fényképnek és látványának közvetlen viszonyát a referens és a punctum fogalmai is leírják. Ez az, amely megsérti, megszúrja a nézőt. A képrészlet, amely a tekintetet vezeti, eszerint nem csupán felkelti a befogadó érdeklődését, vagy megérinti, hanem megdöbbenti, vagy egyenesen megsebzi.[4] A képek, mint művészi produktumként vett tárgyak, eszerint meghatározott szempontrendszerek mentén értelmezhetők.

E mellett az ábrázolási vonatkozás mellett – amely elsősorban a művészeti fotográfiához kapcsolódik – érdemes kitekintést tenni a mindennapi fényképek felé. Azok a felvételek, amelyeket nem alkotói szándék mentén, hanem például dokumentálás vagy emlékmegőrzés céljából készítenek, szintén teljesen más utakon járnak, mint a generált képek. A fényképek az imént tárgyalt közvetlenségük miatt alkalmasak arra, hogy emlékeket őrizzenek, így nem csoda, ha a hétköznapokban gyakran az emlékek többé-kevésbé objektív megőrzőjeként, vagy az emlékek előhívójaként jelenik meg a fénykép, elég csak a családi fényképalbumokra gondolnunk.

És mi köze mindennek a mesterséges intelligencia által készített fényképekhez? Lényegében semmi. Számos fényképértelmezési szempont éppen emiatt nem átültethető a mesterséges képekre, mert nem fénnyel készült, a külvilág képét megjelenítő munkák, így nem alkalmazhatók rájuk azok a feltörési pontok, amelyek a fényképek esztétikai megítélésében kulcsfontosságúak. A mesterséges képek megközelítésének lehetősége mégis ezen a ponton látható. Ha a fényképelméletek túlnyomó többsége olyan jelenégeket vizsgál, amelyek a fényképen megvannak, ám az MI-képeken nincsenek, arra következtethetünk, hogy a két dolog lényegileg különböző. A gond ott van, hogy a különbségtétel egyre nehezebbé válik, mivel a képeket előállító algoritmusok egyre fejlettebbek, alaposabb munkát tudnak végezni. Képesek bizonyos filmek vagy képregények képi világában önálló produktumot létrehozni, de alkalmasak arra is, hogy fényképek egyes részleteit megváltoztassák, meghamisítsák.

A képek valódiságának kérdése egyidős a fényalapú képrögzítés feltalálásával. Manipulált fényképekkel több esetben is találkozhat az, aki a fotográfia művészetének történetét kutatja. Már a 19. században, a fényképezés első évtizedeiben is találhatunk precedenst szándékos képmanipulációra, melynek célja a néző megtévesztése.[5] Kártékony hatásról akkor beszélhetünk, ha a mesterséges a valódi terébe lép. Ismeretes, hogy két évvel ezelőtt az egyik legrangosabb fotográfiai pályázaton a zsűri egy MI-képet választott ki győztesnek. A Sony World Photography Awards 2023 egyik díját egy mesterséges intelligenciával generált kép nyerte el, amelyet a berlini Boris Eldagsen készített. Az alkotó visszautasította az elismerést, mert a célja az volt, hogy párbeszédet indítson erről, ám a kétes reakciók, illetve a zsűri hallgatása okán ez csak kisebb részben tudott csak megvalósulni.[6]

0103

Boris Eldagsen:
PSEUDOMNESIA III
Psychoanalysis Gone Wrong

A mesterséges képek és a fényképek egymással tehát bizonyos helyzetekben képesek elkeveredni, ami azt is eredményezheti, hogy a hagyományos fényképek kiszorulnak saját tereikből, ahogyan a mesterséges képek megjelennek.[7] Több művészettörténeti és művészetfilozófiai irány a képek nagy családját olyan rendszerként írja le, amelyben a festmények mellett jól megférnek a sokszorosítással készült alkotások, például a litográfiák, cinkográfiák, vagy éppen a fényképek. A fényképsokszorosítás és az AI-képek összefüggésének kérdése ott ágazik kétfelé, ahol a cél a megtévesztés, és nem valamilyen művészi szándék. A mesterséges intelligenciával manipulált (deepfake), vagy azzal előállított tartalmakkal a legfőbb probléma az, hogy mindig egyértelmű a manipulálás ténye. Az így készült képek vagy mozgóképek akár rosszindulatú megtévesztések, csalások eszközei is lehetnek.

Mindezek tükrében az is kérdéses, hogy a mesterséges alkotások művészeti produktumnak tekinthetők-e, vagyis van-e olyan művészettörténeti és műfaji beágyazottságuk, amely ezt lehetővé tenné. Erről szakirodalom kevéssé áll még rendelkezésre, mert bár a téma már vizsgált, a műfaj egyelőre túlzottan új. A generált képek azonban csak ezért nem elvetendők. A fotográfia szintén viszonylag új műfaj, amelynek első éveiben nem volt egyértelmű művészeti hasznosíthatósága, bár már évtizedek óta ez az elfogadott álláspont.[8] Nem kizárt, hogy a mesterséges intelligencia felhasználásával készülő alkotások megtalálják a saját helyüket, és a kezdeti, bizonytalan irányvétel után saját útjukra tudnak kanyarodni. Efelé mutat az is, hogy az ilyen képeket már külön pályázatokon várják, elkülönítve a fényképektől.[9]

Jelen esszé elsősorban művészetteoretikai, esztétikai megközelítéseket alkalmaz, amelyek a kulturális és történeti kontextus alapján tudják megvilágítani a kérdést. Bár ezek mentén a műfaji-technikai behatárolást meg lehet tenni, fontos az is, milyen gazdasági következménye lehet a mesterséges képalkotási eljárásoknak, vagyis a fotográfusok számára milyen következményekkel jár a szinte ingyenesen hozzáférhető képek előretörése. Ha a megrendelési munkákból élő fotográfusok képei helyett az újságok és reklámügynökségek ilyen anyagokat fognak használni, annak nyilvánvalóak a kedvezőtlen hatásai. Az azonban emellett is kitűnik, hogy a fénykép mint művészeti kifejezésforma nincs veszélyben. Művészi voltában és hétköznapi szerepében a fénykép mással nem helyettesíthető.

Jegyzetek

[1] Szemléletes példa erre az a mesterséges intelligencia-alapú ,,fényképezőgép”, amely GPS-koordináták, illetve alapvető beállítások alapján képes egy adott helyről képet generálni. A 2023-ban bemutatott, Paragraphica névre keresztelt kamera úgy működik, hogy a helyszínen adatokat gyűjt, amelyeket a mesterséges képgenerálás során figyelembe vesz. A gép megkeresi pontos földrajzi pozícióját, megvizsgálja az ahhoz tartozó időjárási tényezőket, illetve az aktuális napszakot, ezeknek megfelelően állítja elő a mesterséges látványt. A teljes cikk a Punkt.hu-n elérhető: https://punkt.hu/2023/07/01/mi-tortenik-ha-a-kep-a-latvany-helyebe-lep-az-ai-felkinalja-a-fenykepezogepek-alternativajat/.

[2] Roland Barthes: Világoskamra, ford. Marsó Paula, Kijárat, Budapest, 2024, 60-61.

[3] Földényi F. László: A guillotine hosszú árnyéka, Jelenkor, 2023, 129.

[4] Barthes, i. m., 25.

[5] A korábban első tornádófotónak hitt, 1884-ben készült felvétel hitelességét megkérdőjelezték, és kiderült róla, hogy több felvétel részleteiből állították össze, vagyis manipulált kép. Egy nemrég előkerült, 1884 áprilisában Kansasban készült fénykép viszont minden szakmai kritériumnak megfelel, így jelenleg ezt tartják az első hiteles tornádófotónak. Forrás: https://punkt.hu/2025/02/04/nem-az-a-legelso-tornadorol-keszult-felvetel-amelyrol-eddig-azt-gondoltak/.

[6] https://punkt.hu/2023/04/21/a-mesterseges-intelligencia-kepe-nyerte-meg-a-sony-world-photography-awards-egyik-kategoriajanak-fodijat/.

[7] https://punkt.hu/2023/04/25/nevezheto-fenykepnek-a-mesterseges-intelligencia-altal-letrehozott-kep/.

[8] Dr. Sevcsik Hefelle: Fényképészet, Műszaki, Budapest, 1987, 407.

[9] https://punkt.hu/2023/11/05/ujabb-merfoldko-az-ai-altal-generalt-kepek-torteneteben-fotopalyazatot-irtak-ki-a-promptologusoknak/.