Nel'articolo si pone l’attenzione sulle problematiche relative alla costruzione di una banca dati digitale in un contesto in cui i dati non hanno una rigida strutturazione e sono affetti da errori di tipo ortografico e sulla costruzione di un sistema software per la loro consultazione online, condividendo con la comunità scientifica le attività, i metodi, i risultati intermedi e le prospettive che caratterizzano il progetto di informatizzazione del "Grande Dizionario della Lingua Italiana" di Salvatore Battaglia (GDLI). Il progetto, nato dalla collaborazione tra l’Accademia della Crusca e l’Istituto di Linguistica Computazionale “A. Zampolli” del CNR (CNR-ILC), si pone l’obiettivo di realizzare una banca dati interrogabile online con funzionalità di ricerca avanzate. Attualmente la disponibilità di dizionari digitali in Internet registra l’accesso di una vasta platea di utenti e anche il GDLI, da quando è accessibile online nella versione non strutturata, è molto consultato. Il progetto vuole offrire un punto di accesso più articolato e utile agli studi di linguisti e storici della lingua. L’analisi condotta sui dati e sulle potenzialità di sfruttamento delle informazioni ivi contenute ha orientato lo sviluppo verso soluzioni e strategie implementative capaci di controllare e gestire gli errori e costruire un modello ibrido di rappresentazione dei dati, scomposto in più componenti fisici collegati ma autonomi; una risorsa multidimensionale in grado di produrre prospettive di analisi e di consultazione diversificate del dizionario. L’aspetto realizzativo della banca dati ha condizionato la scelta delle funzionalità del sistema di interrogazione, che sono diventate necessariamente dedicate, con specifiche di realizzazione distinte per le diverse dimensioni (componenti) da indagare. In questo scenario l’implementazione software ha seguito un approccio sperimentale, un punto di vista che permettesse di procedere a stadi di avanzamento progressivo e ad una verifica costante delle scelte adottate. Con queste premesse la conclusione del progetto è un obiettivo di medio lungo termine ma che va nella direzione di favorire la valorizzazione di questa importante risorsa lessicografica.

L’informatizzazione del GDLI: risultati, prospettive, sfide future / Eva Sassolini, Sebastiana Cuccurullo, Marco Biffi. - ELETTRONICO. - (2024), pp. 281-286. [10.6092/unibo/amsacta/7927]

L’informatizzazione del GDLI: risultati, prospettive, sfide future

Marco Biffi
2024

Abstract

Nel'articolo si pone l’attenzione sulle problematiche relative alla costruzione di una banca dati digitale in un contesto in cui i dati non hanno una rigida strutturazione e sono affetti da errori di tipo ortografico e sulla costruzione di un sistema software per la loro consultazione online, condividendo con la comunità scientifica le attività, i metodi, i risultati intermedi e le prospettive che caratterizzano il progetto di informatizzazione del "Grande Dizionario della Lingua Italiana" di Salvatore Battaglia (GDLI). Il progetto, nato dalla collaborazione tra l’Accademia della Crusca e l’Istituto di Linguistica Computazionale “A. Zampolli” del CNR (CNR-ILC), si pone l’obiettivo di realizzare una banca dati interrogabile online con funzionalità di ricerca avanzate. Attualmente la disponibilità di dizionari digitali in Internet registra l’accesso di una vasta platea di utenti e anche il GDLI, da quando è accessibile online nella versione non strutturata, è molto consultato. Il progetto vuole offrire un punto di accesso più articolato e utile agli studi di linguisti e storici della lingua. L’analisi condotta sui dati e sulle potenzialità di sfruttamento delle informazioni ivi contenute ha orientato lo sviluppo verso soluzioni e strategie implementative capaci di controllare e gestire gli errori e costruire un modello ibrido di rappresentazione dei dati, scomposto in più componenti fisici collegati ma autonomi; una risorsa multidimensionale in grado di produrre prospettive di analisi e di consultazione diversificate del dizionario. L’aspetto realizzativo della banca dati ha condizionato la scelta delle funzionalità del sistema di interrogazione, che sono diventate necessariamente dedicate, con specifiche di realizzazione distinte per le diverse dimensioni (componenti) da indagare. In questo scenario l’implementazione software ha seguito un approccio sperimentale, un punto di vista che permettesse di procedere a stadi di avanzamento progressivo e ad una verifica costante delle scelte adottate. Con queste premesse la conclusione del progetto è un obiettivo di medio lungo termine ma che va nella direzione di favorire la valorizzazione di questa importante risorsa lessicografica.
2024
978-88-942535-8-0
Me.Te. Digitali. Mediterraneo in rete tra testi e contesti
281
286
Eva Sassolini, Sebastiana Cuccurullo, Marco Biffi
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in FLORE sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificatore per citare o creare un link a questa risorsa: https://hdl.handle.net/2158/1404916
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact