Másfélmillió sajtófotó között böngészhetünk az amerikai Kongresszusi Könyvtár új adatbázisában
20 • 10 • 12Punkt
A Library of Congress (LoC) Newspaper Navigator nevű új szolgáltatása egy mesterséges intelligencia-alapú képkeresési funkció, ami lehetővé teszi, hogy több mint 1,5 millió sajtófotót böngészhessünk a gyűjteményükben található, 1900 és 1963 között megjelent 16 millió oldalnyi digitalizált újságokban. A Newspaper Navigator projekt egy programtervező informatikus PhD hallgató, Benjamin Charles Germain Lee ötletén alapszik, aki a Kongresszusi Könyvtár 2020-as Innovator in Residence programjának résztvevője.
A projekt lényege egy gépi tanuláson alapuló keresőmotor, a LoC Chronicling America projekt továbbfejlesztése, mely már eddig is lehetővé tette, hogy a régi újságfotókat szöveg alapján keressünk az optikai karakterfelismerés (OCR) segítségével, de Lee szoftvere ezt a következő szintre emelte azzal, hogy lehetővé teszi az archívumban a kép szerinti keresést is. Ezt úgy érte el, hogy egy gépi tanulási modellt dolgozott ki több ezer annotáció segítségével, amelyeket valós személyek készítettek a Kongresszusi Könyvtár „A szavakon túl” kezdeményezés részeként. Ezek az adatok segítettek a számítógépnek „megtanulni” a képkategóriák, például a rajzfilmek, az illusztrációk, a térképek és a fényképek közötti különbséget, valamint meghatározták az egyes képek kulcsfontosságú témáját. Ez lehetővé tette számára, hogy a szoftver automatikusan címkézze a fényképeket, és így kereshetővé tegye az adatbázist.
A szolgáltatás egyik hátránya, hogy sajnos nem a legjobb minőségben élvezhetjük a beszkennelt újságokban található fotókat, ellenben a hazai Arcanum által nyújtott (de fizetős) szolgáltatásban ennél sokkal jobb minőségben kereshetünk a sajtóképekre. Az adatbázisban rengeteg történelmi esemény ikonikus fotóját találhatjuk, így például a legelső sajtóképet a Halley-üstökösről, a jéghegyről, ami elsüllyesztette a Titanicot, a Wright testvérek első repüléséről, a Hindenburg léghajóról, de természetesen a történelem fontos alakjaira, vagy akár a képzőművészet neves szereplőire is rákereshetünk. Az adatbázis ezen a linken érhető el.