Alex Agnesini, Isabella Andorlini,
Massimo Magnani, Sara Santoro, Anna Maria Tammaro
Facoltà di Lettere, Università di
Parma
Tecnologie digitali e ricomposizione
dell'antico:
papiri, siti archeologici, biblioteche ed archivi
digitali
Seminario
di Studi
Il mondo della ricerca scientifica
in campo umanistico si è da tempo concentrato
nello studio, sviluppo, realizzazione e, talvolta,
produzione di sistemi innovativi rivolti alla
conservazione, fruizione e valorizzazione di
quanto viene convertito in formato digitale.
Le problematiche delle tecnologie digitali applicate
alla realizzazione di prodotti e servizi che
migliorino ed in certi casi aprano la strada
a nuove linee di ricerca sono di grande attualità
ed interesse, ma è difficile ottenere
una vera sinergia tra tutti gli interessati,
in quanto l’approccio prevalente nel mondo
accademico rimane spesso settoriale e limitato
ad un determinato ambito disciplinare. È
anche insolito attuare una stretta cooperazione
per le risorse digitali tra i ricercatori ed
il personale professionale delle istituzioni
culturali (archivi, biblioteche, musei), già
da tempo impegnati ad acquisire risorse digitali
o ad operare la conversione da analogico a digitale
di oggetti presenti nella collezione. Prevalgono
attualmente le applicazioni commerciali, prodotte
da aziende nazionali ed internazionali del settore,
legate a risorse digitali acquisibili con licenza
d’uso. È bene precisare anche che
le applicazioni commerciali tendono generalmente
a realizzare prodotti utilizzabili da una comunità
di utenti generici, mentre le iniziative intraprese
dal mondo della ricerca prediligono venire incontro
ad esigenze di utilizzatori specialisti.
Nell’ambito della Settimana
della Cultura Scientifica, lo scorso marzo,
è stato organizzato a Parma, da alcuni
Dipartimenti della Facoltà di Lettere,
un Seminario interdisciplinare, dal titolo “Tecnologie
digitali e ricomposizione dell’antico”,
a cui per la prima volta hanno partecipato docenti,
esperti provenienti da enti pubblici di ricerca
insieme ad aziende private ed a numerosi professionisti
impegnati nelle istituzioni culturali. Il Seminario
è stato una prima esperienza di collaborazione
tra specialisti con diverso background disciplinare
ma con comuni interessi (nonché problematiche)
per le applicazioni delle tecnologie del digitale
nel proprio campo di studi. Vanno inoltre evidenziate
alcune collaborazioni di successo tra aziende
e Dipartimenti universitari o del CNR, che sono
state presentate durante il Seminario.
Il Seminario ha passato in rassegna
gli ambiti di maggior interesse oggi per quanto
riguarda la ricerca scientifica nelle scienze
umane, suddivise fra tecnologie per
l’organizzazione ed il recupero dell’informazione,
per i contenuti testuali (sia
immagini digitali e che testi digitali) e tecnologie
per il restauro virtuale.
1. Organizzazione e recupero
dell’informazione
Si tratta principalmente di un
settore rivolto alla realizzazione di cataloghi
in linea e alla memorizzazione di archivi testuali
multilingue di grandi dimensioni, alcuni disponibili
per l’accesso in Internet, altri consultabili
solo su CD-ROM. Le attività messe in
atto dai più importanti Centri di ricerca
scientifica riguardano principalmente la costituzione
di archivi che presentano una coerenza tematica
(per esempio, tutte le opere letterarie italiane
antiche, tutte le opere di un determinato autore,
tutte le opere di una determinata epoca, ecc)
e per i quali sono stati realizzati appositi
programmi di information retrieval
(sistemi di word searching, indicizzatori,
concordatori, rimari, ecc.). Nella maggior parte
dei casi si tratta di interventi che hanno la
finalità di predisporre lessici, vocabolari
sincronici e diacronici e vari tipi di indici.
L’utenza che si rivolge a queste informazioni
è rappresentata da storici della lingua,
da filologi classici e medievali, da editori
critici e solo sporadicamente da studenti universitari.
Le banche dati di testi latini
distribuite attualmente su CD-ROM sono molto
utili per lo studio del lessico e dello stile
(ricerca di singoli lemmi e delle iuncturae)
di uno o più autori. Inoltre permettono
uno studio più approfondito (e più
rapido) dei rapporti intertestuali. Il limite
maggiore di questi preziosi strumenti è
l’assenza dell’apparato critico:
si auspica che le future banche dati comprendano
anche le varianti al testo vulgato e che i motori
di ricerca estendano le indagini anche ad esse.
Attualmente le banche dati contenenti la quasi
totalità di testi latini classici sono:
1) PHI 5.3 (dalle origini
al III d.C. con aggiunta di testi biblici) curato
dal Packard Humanities Institute
(http://www.packhum.org/phi/),
che necessita di un motore di ricerca per essere
interrogato (i più comuni sono Musaios
[1], PHI5 Workplace [2], Diogenes[3]);
2) BTL-3, comprendente
gran parte dei testi della «Bibliotheca
Teubneriana Latina», che è distribuito
con un veloce motore di ricerca;
3) CLCLT-6, distribuito,
come la precedente, da Brepols [4], che comprende i testi della precedente versione di BTL,
testi cristiani tardo antichi e medievali.
Anche la grecistica si avvale
da decenni di Banche dati testuali, disponibili
su CD-ROM oppure online (come ad esempio
TLG, PHI7, PG online,
FGrHist etc.) e interrogabili da motori
di ricerca dedicati o generali (Musaios,
Pharos, Pandora e SNS,
Workplace, Lector, Diogenes
etc.). La genesi e lo sviluppo della più
importante di esse, il Thesaurus Graecae
Linguae
(http://www.tlg.
uci.edu/),
mostra quali difficoltà proponga anche
solo la codifica digitale dell’alfabeto
greco. La soluzione escogitata, il Beta
Code, pur funzionale, implica da un lato
una ridotta portabilità dei fonts derivati,
dall’altro si rivolge alla sola codifica
dei caratteri, e quindi mancano strumenti di
codifica formale. Ciò impedisce strutturalmente
di sviluppare TLG e PHI7,
incorporandovi i dati degli apparati critici
(cf. E. Degani, Il mostro di Irvine,
«Eikasmós» III, 1992, 277s.
= Filologia e storia. Scritti di Enzo Degani,
II, Hildesheim-Zürich-New York 2004, 914s.)
e marcando il testo dal punto di vista grammaticale,
sintattico, stilistico e metrico.
Tali sviluppi sono informaticamente
possibili, benché tutt’altro che
semplici, come dimostra il lavoro di F. Boschetti
(Saggio di analisi linguistiche e stilistiche
condotte con l’ausilio dell’elaboratore
elettronico sui Persiani di Eschilo,
Diss. Università di Trento – Université
de Lille III, a.a. 2003-2004,
http://www.univ-
lille3.fr/theses/
BOSCHETTI_FEDERICO.pdf).
La limitatezza del TLG è palese,
ad esempio, in occasione di nuove scoperte papiracee,
come dimostra il nuovo Iperide (Natalie Tchernetska,
New Fragments of Hyperides from the Archimedes
Palimpsest, «ZPE» CLIV, 2005,
1-6), laddove ricerche volte a identificare
il testo, se incentrate su elementi distintivi
(ad es., i nomi propri), conducono a esiti fuorvianti
proprio per la mancanza dei dati dell’apparato
critico.
2. Enhancement e restauro.
Un settore antichistico ben attrezzato
nell'impiego delle nuove tecnologie digitali
per la didattica e la ricerca è la papirologia,
una disciplina nata poco più di un secolo
fa ed avente per oggetto un materiale delicato,
frammentario e disperso, spesso in precario
stato di conservazione e di fruizione da parte
degli specialisti. La comunità papirologica
si è dotata da quasi un ventennio di
sofisticati strumenti in grado di visualizzare
il materiale papiraceo sottraendolo ai ripostigli
museali, di dominare la complessa crescita dei
dati e di organizzare la gestione delle informazioni
e l'editing dei testi nelle prospettive della
ricerca e dell'insegnamento (un quadro delle
risorse già disponibili è offerto
e aggiornato nel sito dell’Association
Internationale de Papyrologues,
http://www.ulb.
ac.be/assoc/aip /liste.htm).
I papirologi, e quanti si avvicinano
oggi alle problematiche poste dallo studio dei
papiri, sono confortati nell'arduo compito della
decifrazione ed interpretazione dei testi dal
ricorso quotidiano a formidabili strumenti di
lavoro, quali le banche dati di tutti i testi
documentari pubblicati e il loro prezioso registro
inventariale, i cataloghi bibliografici di quelli
letterari, una bibliografia papirologica nata
nel 1936 e aggiornata 4 volte all'anno, ed infine,
last but not least, i siti Web istituzionali
che raccolgo e rendono fruibili in rete le immagini
digitali delle più importanti collezioni
papirologiche al mondo, in parte collegati nel
sistema d'interrogazione APIS creato negli Stati
Uniti.
Più recentemente gli sforzi
degli esperti nelle tecnologie sono stati indirizzati,
con risultati promettenti, a sviluppare sistemi
di imaging di papiri di difficile lettura
ad occhio nudo con sistemi di ripresa ad alta
risoluzione (come hanno mostrato Duilio Bertani
e Luca Consolandi del Centro interdipartimentale
di Riflettografia infrarossa e Diagnostica dei
Beni Culturali dell'Università degli
Studi di Milano a proposito dei famosi papiri
contenenti epigrammi di Posidippo e l'opera
geografica di Artemidoro). Nuove prospettive
di studio dei reperti a distanza sono emerse
nel campo del restauro di pezzi di papiro appartenenti
ad uno stesso archivio, ma spesso separati al
momento del loro recupero e divisi tra collezioni
papirologiche lontane. Con agili software di
gestione delle immagini digitali dei papiri
è adesso possibile procedere a restauri
virtuali che permettono, qualora i frammenti
di uno stesso originale si siano casualmente
conservati e siano stati identificati dagli
studiosi, la ricomposizione del manufatto come
si presentava all'origine e la sua fruizione
per lo studio e la pubblicazione. Un caso illustrativo
sono le carte di un tale Ammon, avvocato di
Panopoli in Egitto, vissuto del secolo IV d.C.,
oggi disperse tra Durham, NC, Colonia, e Firenze,
ma felicemente ricongiunte, anche con tavole
virtuali, nel volume dei P.Ammon II (a cura
di K. Maresch / I. Andorlini, Papyrologica Coloniensia
Vol. XXVI/2, Paderborn, Schöningh 2006).
3. Contenuti testuali e digitalizzazione
del patrimonio
In quest’area di ricerca
e sviluppo esistono numerose collaborazioni
e sinergie tra CNR, dipartimenti di ricerca
e singoli laboratori privati, di cui alcune
illustrate durante il Seminario di Parma da
Andrea Bozzi dell’ILC-CNR e Franco Lotti
dell’IFAC-CNR. Ad esempio BAMBI (Better
Access to Manuscripts and Browsing of Images
—
http://www.ilc.cnr.
it/viewpage.php/sez=ricerca /id=97/vers=ita),
che è un progetto terminato nel 1997,
che ha per la prima volta affrontato il tema
della gestione specialistica di documenti manoscritti
antichi in formato digitale, a scopo di indagini
linguistiche e filologiche. Un altro progetto,
anche questo realizzato dall’Istituto
di Linguistica Computazionale del CNR di Pisa
è SIFIMM (Postazione Filologica Multimodulare).
Il progetto ha reso possibile il perfezionamento
di alcuni moduli di indicizzazione già
sviluppati per il progetto europeo BAMBI, affinché
si rendesse possibile operare su documenti digitali
contenenti testi in alfabeto non latino (per
esempio, alfabeti greco e cirillico). I risultati
ottenuti hanno permesso di avanzare nuove proposte
di ricerca e sviluppo che hanno dato luogo prima
a BIBLIOFILO
(http://www.ilc.cnr.
it/viewpage.php/sez=
ricerca/id=85 /vers=ita)
e, successivamente, a FAD
(http://www.ilc.cnr.it/viewpage.php
/sez=ricerca/id=34/vers=ita).
Il primo progetto ha ulteriormente prodotto
componenti per la gestione online di
immagini e testi soprattutto relativi ad opere
antiche, mentre il secondo ha riguardato biblioteche
e archivi digitali di documenti moderni e contemporanei.
FAD, finanziato interamente dal Ministero per
i Beni Culturali. Direzione generale per i beni
librari e gli istituti culturali, ha visto la
partecipazione di Istituti Culturali quali la
Fondazione Conti, il Gabinetto Vieusseux, la
Fondazione Rosselli, L’Istituto Papirologico
Vitelli, coordinati, per quanto riguarda gli
aspetti scientifici, dall’ILC-CNR. La
documentazione digitale prodotta ammonta a circa
300.000 immagini di alto valore storico e culturale.
Il CNR ha coordinato anche un Progetto Speciale
relativo alla progettazione di un sistema di
riconoscimento automatico di caratteri (OCR)
su libri a stampa antichi: LaperLA: Lettore
Automatico per Libri Antichi
http://www.ilc.cnr.it
/viewpage.php/sez=
ricerca/id=75/vers=ita).
Hanno partecipato ai lavori di analisi del problema
e alla sperimentazione, tra gli altri, l’ILC,
l’ILIESI, l’ISTI. I risultati prototipali
soddisfacenti hanno consentito di avanzare una
proposta successiva nell’ambito del Progetto
Finalizzato Beni Culturali del CNR. Qui due
Istituti tecnologici (ISTI e ILC), con la collaborazione
del Dipartimento di Elettronica, Informatica
e Sistemistica dell’Università
della Calabria e altri organi del CNR (come,
per esempio, l’Istituto di Studi Giuridici
Internazionali), hanno cooperato per lo sviluppo
di una rete neurale che successivamente ha ottenuto
il deposito come marchio brevettato (A.Bozzi,
G.Fedele, A.Eisinberg, Metodo e apparato
per il riconoscimento automatico di caratteri).
Tutti gli Istituti dell’Area
umanistica del CNR hanno realizzato, col coordinamento
dell’ILIESI prima e dell’ILC dopo,
il progetto BIBLOS
(http://www.biblos.cnr.it/):
biblioteca umanistica virtuale del CNR che ha
lo scopo di mettere a disposizione degli utenti
Internet tutte le informazioni relative a programmi,
pubblicazioni e attività realizzati dai
ricercatori e tecnologi degli Istituti afferenti
all’ex comitato 08 del CNR, ora afferenti
in parte al Dipartimento Identità Culturale,
in parte al Dipartimento Patrimonio Culturale.
Il Seminario ha dato l’opportunità
di conoscere un esauriente stato dell’arte
per le applicazioni delle tecnologie digitali
a papiri, siti archeologici, archivi e biblioteche
digitali e di avere informazioni sui progetti
di ricerca in corso coordinati da Dipartimenti
universitari ed istituti di ricerca, anche in
collaborazione con aziende. L’iniziativa
della Facoltà di Lettere dell’Università
di Parma si vuole proporre come incontro periodico,
considerando gli indubbi vantaggi della condivisione
di conoscenza di applicazioni tecnologiche avanzate
in diversi contesti dello stesso ambito umanistico
e dei benefici della diffusione più ampia
dei risultati raggiunti al pubblico dei professionisti
e di tutti gli interessati.