Archivio testuale dei "Periodici Milanesi"
Il corpus dei materiali testuali è costituito da una raccolta di periodici milanesi della prima metà dell’Ottocento, che è alla base dei 5 volumi “La stampa periodica milanese della prima metà dell’Ottocento: testi e concordanze”, importante opera curata da Stefania De Stefanis Ciccone, Ilaria Bonomi e Andrea Masini e pubblicata da Giardini Editore (Pisa) nel 1984. La realizzazione dell’opera è stata curata, sul versante informatico, dall’Istituto di Linguistica Computazionale del Consiglio Nazionale delle Ricerche (ILC-CNR), nelle persone di Eugenio Picchi e Remo Bindi. L’archivio testuale è stato arricchito con annotazioni linguistiche di varia natura (in particolare, morfo-sintattiche, lessicali e semantiche) realizzate in modo semi-automatico con il supporto di software sviluppato presso l’ILC-CNR.
L’archivio testuale (con le relative annotazioni linguistiche) prodotto negli anni ’80 era codificato in un formato di rappresentazione legata alla tecnologia del tempo. La complessità di questo formato e la strategia di compressione delle informazioni contenute ne stava pregiudicando la conservazione nel tempo. Il suo recupero è stato condotto all’interno di una linea strategica di attività dell’ILC-CNR, dedicata alla salvaguardia, conservazione e valorizzazione dei testi dell’Archivio Storico dell’ILC-CNR e coordinata da Manuela Sassi, in collaborazione con l’Accademia della Crusca con il coordinamento di Marco Biffi.
Al processo di recupero dei testi e delle annotazioni ad esso associate ha fatto seguito la conversione nel formato XML TEI (versione P5), che rappresenta ad oggi lo standard internazionalmente riconosciuto per la codifica digitale di testi umanistici, che è stata realizzata da Sebastiana Cucurullo per ILC-CNR.