Pagina Principale del sito Come contattarci e copyright Iscriviti ai forum e alla newsletter Agenda degli eventi I temi trattati Archivio delle prime pagine

     

Francesca Tomasi
Testi elettronici

 

 


Questa sezione dedicata ai testi elettronici vuole presentare alcuni classici della letteratura italiana sottoposti a diversi procedimenti automatici di analisi e di intervento computazionale, con l'ambizione di creare una banca dati testuale codificata, disponibile all'utenza[1].
Le pratiche elettroniche a tutt'oggi esemplificate riguardano:
- realizzazione di un costrutto ipertestuale HTML (con l'impiego dei fogli di stile CSS) a fini didattici[2] .
- codifica XML[3] valida, basata sull'utilizzo della DTD TEI, nella sua versione Lite per XML [4] e dei fogli di stile XSL per la formattazione del documento.

Tutti i testi conformi alla TEI contengono:
- una testata TEI, codificata come <teiHeader> (frontespizio elettronico), che raccoglie la serie delle informazioni paratestuali e metatestuali di riferimento (descrizione dell'esemplare elettronico, di quello cartaceo di riferimento, delle norme di codifica seguite e delle revisioni effettuate)
- il testo vero e proprio, marcato con l'elemento <text>, suddiviso in tre elementi:

  • <front> (avantesto: frontespizio dell'esemplare cartaceo di riferimento e materiali introduttivi come prefazioni, dediche, sommari, introduzioni, indici etc.)

  • <body> (corpo del documento, a sua volta strutturato in partizioni significative del componimento, variabili a seconda della tipologia: testo in prosa, in versi, testo teatrale, ecc.)

  • <back> (materiali annessi come glossari, indici, note, bibliografie, colophon etc.)
Ogni testo codificato secondo le specifiche TEI viene quindi codificato secondo questa struttura:
<TEI.2>
<teiHeader>[informazioni della testata TEI] </teiHeader>
<text>
<front> [materiali dell'avantesto] </front>
<body> [testo unitario] </body>
<back> [materiali annessi] </back>
</text>
<TEI.2>

Per agevolare il riconoscimento delle porzioni è stata adottata una codifica separata di ciascuna delle 4 porzioni (teiHeader, il front, il body e il back).
Ogni testo, accompagnato dall'indicazione dei criteri di codifica seguiti (elementi ritenuti pertinenti in fase di analisi delle istanze testuali), è strutturato in un frameset con navigatore che riporta la serie degli interventi realizzati sul testo e quindi permette la consultazione delle partizioni:

- il frontespizio elettronico, nel rispetto delle specifiche della DTD TEI per la sezione <teiHeader>[5].
- la serie degli elementi che costituiscono l'avantesto (<front>)
- il corpo del documento (<body>) cioè il testo vero e proprio [6]
- la serie dei materiali annessi (<back>)
- il codice XSL, cioè il linguaggio adottato per la formattazione del documento XML [7]

 

Elenco dei testi disponibili:


Alberti, Leon Battista - De pictura

Campanella, Tommaso - La città del sole

Della Casa, Giovanni - Galateo

Machiavelli, Niccolò - Il Principe

Machiavelli, Niccolò - Mandragola (ipertesto HTML)

Poliziano, Angelo - Stanze

Tarchetti Igino Ugo - Fosca

Tozzi, Federigo - Tre croci



Scarica la DTD TEI-Lite per XML

Per i tutorials dedicati agli elementi base dei linguaggi clicca qui

 




 

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Formazione e Didattica Il Bollettino del '900 Informatica Umanistica I percorsi di Griselda Online

[1] L'aggiornamento dei testi è periodico, quindi si consiglia di visitare spesso la sezione.

[2] Cfr., per la descrizione dei criteri di realizzazione del prodotto, direttamente il file. Per quanto concerne i principi teorici relativi al linguaggio cfr. la sezione del manuale dedicata ai linguaggi di codifica. Per comprendere come implementare un ipertesto ricorrendo al linguaggio HTML cfr. il tutorial specifico.

[3] Codificare un testo impiegando questo linguaggio significa effettuare una precisa scelta degli aspetti del testo letterario sui quali si intende lavorare, vale a dire costruire un modello teorico del testo. Vari e molteplici sono infatti gli ambiti sui quali lavorare: dalla strutturazione del componimento (individuazione del genere: testo in prosa, in poesia, testo teatrale, ecc.) alla individuazione degli elementi pertinenti (nomi di persona, riferimenti temporali, citazioni di luoghi, ecc.), all'indagine dell'aspetto retorico-stilistico, alla predisposizione dell'apparato ai fini dell'edizione critica, all'individuazione dei fenomeni grafici, linguistici, ecc.
Ogni fenomeno testuale può infatti essere codificato e cioè interpretato.
Questo significa che ciascuno di questi fenomeni è oggetto di reperimento in fase di interrogazione del testo con un opportuno motore di ricerca. Per i dettagli sugli aspetti tecnici e operativi del mark up XML, cfr. il tutorial. Per quanto concerne la trattazione teorica cfr. la sezione del manuale dedicata ai linguaggi di codifica.


[4] Cfr. nella sezione del manuale sui linguaggi di codifica la parte sulla TEI. Gli elementi che sono stati codificati rispettano la semantica delle indicazioni della TEI nella sua versione lite, cioè con un numero ridotto di marcatori rispetto alla versione estesa (per tutte le versioni esistenti della TEI cfr. il sito delle Guidelines al website della Text Encoding Initiative). Per una descrizione di quali sono questi elementi "codificabili", cfr. il manuale, disponibile in lingua italiana, al sito del CRILET http://crilet.
scu.uniroma1.it
/ricerca/SGML-XML/
teiu5-it/teiu5-it.html
.

[5] Cfr. nella sezione del manuale dedicata ai linguaggi di codifica la parte sulla TEI e il tutorial dedicato alla TEI-XML.

[6]Per comprendere gli interventi di codifica effettuati sul testo è possibile visualizzare il codice sorgente dal browser.

[7] Si noterà infatti che nel documento XML il codice non contiene nessuna indicazione circa il layout degli elementi. Il tutto è delegato al foglio di stile. Si è deciso di assegnare certe caratteristiche grafiche (colore del font diverso) ad alcune sezioni testuali (per cui si vedano le norme di codifica di ogni testo elettronico). Tutte le partizioni che quindi nel documento XML sono codificate in questo modo assumeranno, in fase di visualizzazione, le caratteristiche di formattazione descritte nel foglio di stile.

  Università degli Studi di Bologna
e Gedit Edizioni
AddThis Social Bookmark Button
Altre informazioni

 

Formazione e Didattica Il Bollettino del '900 Informatica Umanistica I percorsi di Griselda Online

 

 

 

Risorse on line Il Bollettino del '900 Informatica Umanistica I percorsi di Griselda Online Il Glossario di Informatica Umanistica