Ogromna zbirka srednjeveški judovski rokopisi Kairska geniza, kot jo imenujejo, doživlja prelomni trenutek zaradi umetne inteligence. Po desetletjih, v katerih je bil dostop do majhnega dela gradiva enostaven, je kombinacija množična digitalizacija In sistemi za prepoznavanje besedila resnično začenjajo odpirati ta edinstveni arhiv raziskovalcem in širši javnosti.
Kar se je do nedavnega zdelo kot sanje filologov in zgodovinarjev – sposobnost, da išči, beri in primerjaj Zamisel o tem, da bi bilo na stotine tisoč srednjeveških hebrejskih fragmentov dostopnih s katerega koli računalnika, je postala konkreten projekt. Prek platforme Ktiv Narodne knjižnice Izraela in programa MiDRASH so bili ustvarjeni predhodni prepisi praktično vseh fragmentov Genize, zdaj pa potekajo priprave na njihovo revizijo, izboljšanje in odprto objavo.
Ogromni srednjeveški arhiv, končno berljiv
Razpis Kairska geniza Velja za največjo in najraznolikejšo zbirko srednjeveških judovskih dokumentov, ohranjenih na svetu. Judovska skupnost egiptovske prestolnice je tam skoraj tisoč let hranila verska, pravna, trgovska in literarna besedila, ki jih zaradi tradicije, da se spisov v imenu Boga ne uničuje, ni bilo mogoče preprosto zavreči. Rezultat je bila zbirka, ki naj bi danes obsegala približno [manjkajoče število]. 400.000 drobcev, ohranjen predvsem zaradi suhega podnebja Egipta.
Kljub svojemu pomenu je bila zbirka le delno izkoriščena: do nedavnega je bila katalogizirana manj kot tretjina gradiva in komaj 10–15 % jih je imelo prepis berljivo. Preostanek, čeprav digitaliziran in dostopen v slikovni obliki, je bil še vedno težaven za sistematično delo, saj branje srednjeveških kurzivnih ali polkurzivnih hebrejskih rokopisov zahteva veliko izkušenj in časa.
Nova faza projekta spreminja to pokrajino. Mednarodna ekipa je na podlagi infrastrukture Ktiva – digitalne baze podatkov vseh znanih hebrejskih rokopisov, ki jo upravlja Izraelska nacionalna knjižnica – razvila sistemi za avtomatsko prepisovanje sposoben pretvoriti te fragmente v iskanje po digitalnem besedilu, vsaj v prvi različici, ki bo nato izpopolnjena.
Glede na podatke, ki jih je objavila institucija, so bili predhodni prepisi že ustvarjeni za praktično vse elemente kairske genize, poleg tega pa še za na tisoče dodatnih hebrejskih rokopisov izvirajo iz drugih srednjeveških zbirk. Za področje, ki je postopoma delovalo več kot stoletje, je skok v obsegu težko preceniti.
MiDRASH: Umetna inteligenca in humanistika v službi hebrejskih rokopisov
V središču te preobrazbe je MiDRASH (Migracije besedilnih in pisarskih tradicij z veliko računalniško analizo srednjeveških rokopisov v hebrejski pisavi), interdisciplinarni projekt ki združuje strokovnjake iz Izraela in Evrope. Pobuda se je začela leta 2023 zahvaljujoč 10 milijonom evrov vrednemu nepovratnemu sredstvu ERC Synergy, ki ga je Evropski raziskovalni svet podelil za obdobje šestih let, kar je prvo tovrstno nepovratno sredstvo, posebej namenjeno judovskim študijam.
Cilj projekta MiDRASH ni omejen zgolj na prepisovanje starih besedil. Kot pojasnjuje eden od direktorjev, profesor Daniel Stökl Ben Ezra, je ambicija Rekonstrukcija srednjeveške judovske literarne kulture knjige, sledenje, kateri avtorji citirajo druge, kako rabinski komentarji (midrašimi) krožijo med muslimanskimi in krščanskimi skupnostmi ali kako se pisna izročila spreminjajo skozi stoletja.
Da bi to omogočili, se je ekipa odločila za delo na odprtokodni platformi. SkriptorijSistem, zasnovan za samodejno prepisovanje rokopisov in napisov, razvija posebne modele za srednjeveško hebrejsko pisavo, usposobljene na tisočih prepisih, ki so jih strokovnjaki ročno sestavljali več let. Rezultat je sistem, ki lahko segmentira črte in besede v starodavnih slikah ter jih pretvori v urejljivo besedilo.
Odgovorni poudarjajo, da čeprav začetni prepisi vsebujejo napake – kar je neizogibno pri nepravilni pisavi, zlomljenih fragmentih ali obledelem črnilu – njihovi praktična uporabnost To je ogromno: omogočajo vam hitro iskanje biblijskih odlomkov, delov Talmuda, pisem, pogodb ali liturgičnih besedil, kar je prej zahtevalo potrpežljivo branje stran za stranjo.
Od mikrofilmov do odprtih platform: dolga pot

Trenutna digitalna revolucija srednjeveški judovski rokopisi Ni se pojavil iz nič. Nacionalna knjižnica Izraela sama spominja, da je bil že leta 1950 na pobudo predsednika vlade Davida Ben-Guriona ustanovljen Inštitut za mikrofilmske hebrejske rokopise. Ker ni bilo realno fizično preseliti vseh zbirk v Jeruzalem, je bila rešitev fotografiranje čim več zbirk na mikrofilm, s čimer so bili postavljeni temelji za velik vizualni arhiv.
Skozi desetletja so bili nekateri vključeni 1.500 zbirke Iz različnih virov, od leta 2006 naprej, je bilo gradivo iz kairske genize vključeno v tako imenovani projekt Friedberg Geniza, ki je pospešil njegovo sistematično digitalizacijo. Leta 2014 je Nacionalna knjižnica začela pretvarjati svoj fotografski arhiv v digitalno zbirko, dostopno na spletu, kar je prvič omogočilo vsakemu uporabniku, da na spletu išče in si ogleduje tisoče hebrejskih rokopisov.
MiDRASH neposredno gradi na tem prejšnjem delu. Z uporabo Ktivove infrastrukture, ki je že združila večino znanih hebrejskih rokopisov v eno samo podatkovno bazo, ekipa uporablja algoritme samodejno učenje za prepoznavanje črk, besed in besedilnih struktur. Ta kombinacija centraliziranega arhiva in naprednih računalniških orodij se izogne eni glavnih težav, ki obstajajo na drugih področjih, kot je preučevanje arabskih rokopisov, kjer je gradivo veliko bolj razpršeno.
Dr. Tsafra Siew, vodja raziskovalnih projektov v Nacionalni knjižnici, opredeljuje MiDRASH kot pravi prevojna točka za vse, ki delajo s srednjeveškimi hebrejskimi rokopisi. Po njegovem mnenju korak naprej ni le v olajšanju dostopa, temveč tudi v omogočanju vrst analiz, ki so bile zaradi samega obsega nemogoče, ko je bilo treba vsak dokument brati ročno in skoraj samostojno.
Delavnice za mednarodno sodelovanje in transkripcijo
Projekt MiDRASH deluje kot mednarodni konzorcij, ki združuje tehnično in humanistično strokovno znanje. Med glavnimi raziskovalci so profesor Nachum Dershowitz (Univerza v Tel Avivu), dr. Avi Shmidman (Univerza Bar-Ilan) in profesorica Judith Olszowy-Schlanger (Univerza v Oxfordu), skupaj z ekipami z Univerze v Haifi, Izraelske nacionalne knjižnice in Projekt Princeton Geniza, ki jo je režirala profesorica Marina Rustow.
Pobuda še zdaleč ni omejena le na laboratorijsko delo, temveč odpira tudi možnosti za sodelovanje javnosti. Od 24. do 27. novembra je bil v Jeruzalemu organiziran obsežen dogodek s spletnim pretakanjem. "Prepisovalni maraton" osredotočeno na srednjeveške in sodobne hebrejske rokopise v kurzivni in polkurzivni pisavi. Med temi sejami usposobljeni prostovoljci pregledujejo in popravljajo prepise, ki jih ustvari umetna inteligenca.
Ta sodelovalni pristop ima dvojni cilj. Po eni strani izboljšati kakovost in natančnost Po eni strani se analizirajo sama besedila, po drugi strani pa se za nadaljnje učenje modelov prepoznavanja uporabljajo človeški popravki, tako da se v prihodnosti zmanjša število napak in da se bolje prepoznajo tudi najbolj problematične roke. Ideja je, da se sistem postopoma uči iz nakopičenih izkušenj filologov, paleografov in specialistov za hebrejščino.
Izraelska nacionalna knjižnica je sporočila, da bodo dokončni prepisi kairske genize vključeni v zbirko Ktiv in na voljo javnosti skupaj z izvirne slike vsakega rokopisa. Na ta način lahko vsak raziskovalec primerja, kar vidi naprava, s tem, kar je vidno v faksimilu, s čimer se ohrani preglednost in omogoči nova branja ali prihodnje popravke.
Nova vprašanja za staro zgodbo
Ko je faza množičnega prepisovanja končana, si vodje projekta prizadevajo iti daleč dlje od zgolj dostopa. Načrt je, da bodo lahko izvajali jezikovna in besedilna analiza v velikem obsegu: odkrivanje verig citatov, prepoznavanje parafraz, rekonstrukcija idejnih poti ali sledenje razvoju določenih teoloških in pravnih motivov skozi stoletja.
V praksi to pomeni, da srednjeveški judovski rokopisi niso več zgolj posamezni kosi na policah ali v digitalnih arhivih in začnejo delovati kot medsebojno povezana mreža besedilUmetna inteligenca pomaga najti vzorce, podobnosti in ponovitve, ki bi se pri povsem individualnem branju izgubili, strokovnjaki pa zagotavljajo zgodovinski in filološki kontekst za razlago pomena teh povezav.
Nekateri specifični interesi ekipe vključujejo sledenje poti midrašima, rabinskih pripovedi in komentarjev, ki so krožili med judovskimi skupnostmi na muslimanskih in krščanskih ozemljih. Zmožnost kartiranja, kako se različice istega besedila razlikujejo glede na regijo ali obdobje, odpira vrata boljšemu razumevanju ... kulturni stiki, notranji konflikti in doktrinarne reinterpretacije, ki so se zgodile v srednjem veku.
Raziskovalci vztrajajo, da je strojna transkripcija, kljub vsem nepopolnostim, le začetek. Na tej podlagi bo mogoč nadaljnji razvoj. primerjalne študije besedišče, sintaksa ali slogi pisanja, pa tudi družbene in ekonomske analize, ki temeljijo na pismih, trgovinskih pogodbah ali pravnih dokumentih, ki so bili do sedaj komaj sistematično raziskani.
Globalni vpliv in priložnosti za Evropo
Čeprav projekt izvira in ga koordinira Izrael, se njegovi učinki v celoti raztezajo na evropsko akademsko skupnost. Nepovratna sredstva ERC Synergy, ki financirajo MiDRASH, so del politike Evropske unije za podpirati digitalne infrastrukture za humanistiko, več glavnih raziskovalcev pa dela na univerzah v Franciji, Združenem kraljestvu in drugih državah.
Za evropske strokovnjake za mediteransko zgodovino, srednjeveški judovski sistem ali klasični islam predstavlja tako obsežna in iskalna baza podatkov pomembno spremembo. Do sedaj je bila rekonstrukcija življenja judovskih skupnosti, ki so živele na muslimanskih ozemljih – kjer so muslimani sploh živeli – zapleten podvig. 90 % srednjeveškega judovskega prebivalstva— Zahtevalo je potovanja in omejen dostop do arhivov. S postopnim odpiranjem Ktiva je velik del tega gradiva postal dostopen s katerega koli kampusa ali raziskovalnega centra.
Poleg tega metodologija, razvita v projektu MiDRASH, ponuja model, ki ga je mogoče razširiti na druge evropske dokumentarne zbirke: od zbirk latinskih rokopisov do notarskih ali cerkvenih arhivov. Zamisel o združitvi digitalizacije, avtomatske transkripcije in javnega sodelovanja se pojavlja kot ponovljiva pot ohraniti in preučiti druga območja kulturne dediščine, ki jim grozi propadanje.
Vodje projekta so prepričani, da bo objava rezultatov v strokovno recenziranih znanstvenih revijah utrdila ta pristop v okviru akademskih standardov. Medtem pa odprt dostop Slike in prepisi obljubljajo, da bodo olajšali skupno delo med univerzami v Izraelu, Evropi in Ameriki ter ustvarili širše raziskovalne mreže okoli srednjeveških judovskih rokopisov.
Napredek umetne inteligence, uporabljene pri kairski genizi in drugih hebrejskih rokopisih, spreminja skoraj neobvladljiv arhiv v živi in rastoči virKar je nekoč zahtevalo leta natančnega branja, je zdaj mogoče izslediti v nekaj sekundah, ne da bi se pri tem zmanjšal pomen strokovnega dela, temveč ravno nasprotno: sprosti se čas za postavljanje kompleksnejših vprašanj in poglobljeno interpretacijo dediščine, ki postopoma preneha biti skriti zaklad in postane skupni vir na svetovni ravni.
