Il contributo mette a fuoco alcuni problemi generali relativi alla costituzione di corpora rappresentativi per la redazione di dizionari, partendo dal caso concreto del "Vocabolario dell’italiano post-unitario", che, per la sua natura ibrida, offre un quadro completo sia delle criticità della lessicografia sincronica sia di quella storica. Si introduce pertanto il concetto di "Banca linguistica" in cui convergono diverse tipologie di corpora, un "metamotore" di ricerca per la consultazione delle banche dati esistenti e sistemi di integrazione con i dizionari elettronici esistenti. Infine ci si sofferma sul concetto di 'relatività quantistica' dei dati estrapolabili dalle ricerche informatico-linguistiche. [The paper focuses on some general problems about representative corpora for the compilation of dictionaries. It starts from the concrete case of the "Vocabolario dell’italiano post-unitario", which, due to its hybrid nature, offers a complete view of both the criticalities of synchronic lexicography and of the historical one. Therefore is introduced the concept of "Banca linguistica", that is a platform in which different types of corpora, a search "meta-engine" of the existing databases, and tools of access to existing electronic dictionaries converge. A final paragraph is dedicated to the concept of 'quantum relativity' of data of computational linguistics].
Strumenti informatico-linguistici per la realizzazione di un dizionario dell’italiano post-unitario / Marco Biffi. - STAMPA. - (2018), pp. 99-107. (Intervento presentato al convegno JADT 2018, 14th International Conference on the Statistical Analysis of Textual Data tenutosi a Roma nel 12-15 giugno 2018).
Strumenti informatico-linguistici per la realizzazione di un dizionario dell’italiano post-unitario
Marco Biffi
2018
Abstract
Il contributo mette a fuoco alcuni problemi generali relativi alla costituzione di corpora rappresentativi per la redazione di dizionari, partendo dal caso concreto del "Vocabolario dell’italiano post-unitario", che, per la sua natura ibrida, offre un quadro completo sia delle criticità della lessicografia sincronica sia di quella storica. Si introduce pertanto il concetto di "Banca linguistica" in cui convergono diverse tipologie di corpora, un "metamotore" di ricerca per la consultazione delle banche dati esistenti e sistemi di integrazione con i dizionari elettronici esistenti. Infine ci si sofferma sul concetto di 'relatività quantistica' dei dati estrapolabili dalle ricerche informatico-linguistiche. [The paper focuses on some general problems about representative corpora for the compilation of dictionaries. It starts from the concrete case of the "Vocabolario dell’italiano post-unitario", which, due to its hybrid nature, offers a complete view of both the criticalities of synchronic lexicography and of the historical one. Therefore is introduced the concept of "Banca linguistica", that is a platform in which different types of corpora, a search "meta-engine" of the existing databases, and tools of access to existing electronic dictionaries converge. A final paragraph is dedicated to the concept of 'quantum relativity' of data of computational linguistics].I documenti in FLORE sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.