Il contributo si sofferma su alcuni aspetti linguistico-informatici fondamentali per la progettazione di un corpus rappresentativo dell'italiano post-unitario che serva da base per la redazione di voci di un dizionario. In particolare vengono esaminati: problemi connessi al copyright dei testi utilizzati, criteri di rappresentatività del corpus, problemi relativi alla realizzazione di un metamotore dei corpora già esistenti, codifiche del testo elettronico. Sviluppa il concetto di parabola dimensionale dei corpora in diacronia e di banca linguistica come strumento composito di base ormai insostituibile per rappresentare una lingua nazionale.
Progettare il corpus per il vocabolario postunitario / Biffi, Marco. - STAMPA. - (2016), pp. 259-280.
Progettare il corpus per il vocabolario postunitario
BIFFI, MARCO
2016
Abstract
Il contributo si sofferma su alcuni aspetti linguistico-informatici fondamentali per la progettazione di un corpus rappresentativo dell'italiano post-unitario che serva da base per la redazione di voci di un dizionario. In particolare vengono esaminati: problemi connessi al copyright dei testi utilizzati, criteri di rappresentatività del corpus, problemi relativi alla realizzazione di un metamotore dei corpora già esistenti, codifiche del testo elettronico. Sviluppa il concetto di parabola dimensionale dei corpora in diacronia e di banca linguistica come strumento composito di base ormai insostituibile per rappresentare una lingua nazionale.I documenti in FLORE sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.