Grande dizionario della lingua italiana
Il corpus contiene attualmente tutti i volumi del GDLI (tranne il Supplemento 2009) in una versione provvisoria e sperimentale, perfettibile mediante il lavoro di revisione che tutt’ora prosegue presso l’Accademia, come è necessario per un’opera di questa mole. Si è comunque deciso di mettere immediatamente lo strumento (realizzato a tempo di record) nelle mani degli studiosi, benché presenti non pochi difetti. Infatti per ora la ripulitura è stata minima, ed è stata svolta in forma automatica all’interno del flusso della digitalizzazione. Sono state indicizzate tutte le forme individuate da una procedura che ha utilizzato la trascrizione prodotta dal sistema OCR (Finereader), avendo prima ricostruito l’unità delle parole sillabate nei cambi pagina (perché potessero essere individuate dalle procedure di ricerca).
Ai fini della consultazione, sono state implementate due modalità di ricerca: una ricerca libera per parola che estrae tutti contesti in cui si trova almeno una delle parole inserite e una ricerca in sequenza, che consente di individuare porzioni di testo (compresi i segni interpuntivi). Entrambe le ricerche sono fulltext. I risultati della ricerca indicano il volume di appartenenza, il numero di pagina, il primo e l’ultimo lemma contenuti nella pagina. Il risultato viene evidenziato all’interno di un contesto breve. Accanto al risultato, sono presenti i pulsanti che permettono di ampliare la porzione di testo visualizzata, o di accedere alla pagina in formato PDF e facsimile JPG. Oltre che alla modalità di ricerca aperta, è possibile accedere anche all'elenco delle forme indicizzate (in ordine alfabetico o ordinate per frequenza) e all’elenco degli autori citati (con rimando alla pagina dell’indice che contiene i dati a essi relativi). L'elenco delle abbreviazioni consente di accedere alle occorrenze indicizzate per l'abbreviazione selezionata.
Infine, una sala di lettura permette di accedere a uno scaffale digitale in cui possono essere sfogliati i volumi per immagini. Ogni scatto è collegato alla trascrizione in formato PDF della pagina relativa.