Il "Vocabolario storico della cucina italiana postunitaria" (VoSCIP) è un dizionario storico di una lingua speciale, quella della cucina, che ha avuto una notevole importanza anche nel quadro dell’individuazione di un modello linguistico nazionale soprattutto all’indomani dell’Unità. Il dizionario si basa su un corpus rappresentativo (attualmente di 42 testi), ma che per sua natura è elastico, e aperto, e viene quindi progressivamente incrementato. Le prime voci campione (quali per esempio "cappelletti", "anolini", "tagliatelle", "bagnomaria") presentate in vari convegni e in articoli in volume e riviste, basate su un corpus ristretto a 28 testi, hanno messo in luce alcune criticità che hanno spinto a una ulteriore riflessione metodologica. Proprio alcuni aspetti di tali approfondimenti sono oggetto del contributo che proponiamo: a) la struttura della voce in forma differenziata ('leggera' e 'complessa'); b) il trattamento delle collocazioni emergenti dagli strumenti statistici di analisi del corpus; c) la lemmatizzazione di parole composte a fronte della polimorfia morfologica emergente dalla profondità diacronica del corpus; d) il corretto equilibrio tra esempi citati nella voce e possibilità di un’interrelazione diretta con la banca dati. [The "Vocabolario storico della cucina italiana postunitaria" (VoSCIP) it is a historical dictionary of the language of the cooking, which has also had a considerable importance for identifying a national linguistic model after the Unity of Italy. The dictionary is based on a representative corpus (today 42 texts), but by its nature it is a work in progress, open, and it is progressively increasing. The first exemplar entries (such as "cappelletti", "anolini", "tagliatelle", "bagnomaria") had been presented in various conferences and in some articles; the entries had been based on a restricted corpus (28 texts) and they have highlighted some critical issues, so it was necessary a further methodological reflection. The aim of our paper is to propose some aspects of these investigations and this methodological reflection: a) the structure of the voice in a differentiated form ('light' and 'complex'); b) the treatment of emerging positions from the statistical analysis tools of the corpus; c) the lemmatization of compound words in the face of the morphological polymorph emerging from the diachronic depth of the corpus; d) the correct balance between the examples mentioned in the voice and the possibility of a direct interrelation with the database].
Dal corpus al dizionario: prime riflessioni lessicografiche sul Vocabolario storico della cucina italiana postunitaria (VoSCIP) / Marco Biffi, Ugo Vignuzzi, Patrizia Bertini Malgarini. - STAMPA. - (2018), pp. 90-98. (Intervento presentato al convegno JADT 2018, 14th International Conference on the Statistical Analysis of Textual Data tenutosi a Roma nel 12-15 giugno 2018).
Dal corpus al dizionario: prime riflessioni lessicografiche sul Vocabolario storico della cucina italiana postunitaria (VoSCIP)
Marco Biffi
;
2018
Abstract
Il "Vocabolario storico della cucina italiana postunitaria" (VoSCIP) è un dizionario storico di una lingua speciale, quella della cucina, che ha avuto una notevole importanza anche nel quadro dell’individuazione di un modello linguistico nazionale soprattutto all’indomani dell’Unità. Il dizionario si basa su un corpus rappresentativo (attualmente di 42 testi), ma che per sua natura è elastico, e aperto, e viene quindi progressivamente incrementato. Le prime voci campione (quali per esempio "cappelletti", "anolini", "tagliatelle", "bagnomaria") presentate in vari convegni e in articoli in volume e riviste, basate su un corpus ristretto a 28 testi, hanno messo in luce alcune criticità che hanno spinto a una ulteriore riflessione metodologica. Proprio alcuni aspetti di tali approfondimenti sono oggetto del contributo che proponiamo: a) la struttura della voce in forma differenziata ('leggera' e 'complessa'); b) il trattamento delle collocazioni emergenti dagli strumenti statistici di analisi del corpus; c) la lemmatizzazione di parole composte a fronte della polimorfia morfologica emergente dalla profondità diacronica del corpus; d) il corretto equilibrio tra esempi citati nella voce e possibilità di un’interrelazione diretta con la banca dati. [The "Vocabolario storico della cucina italiana postunitaria" (VoSCIP) it is a historical dictionary of the language of the cooking, which has also had a considerable importance for identifying a national linguistic model after the Unity of Italy. The dictionary is based on a representative corpus (today 42 texts), but by its nature it is a work in progress, open, and it is progressively increasing. The first exemplar entries (such as "cappelletti", "anolini", "tagliatelle", "bagnomaria") had been presented in various conferences and in some articles; the entries had been based on a restricted corpus (28 texts) and they have highlighted some critical issues, so it was necessary a further methodological reflection. The aim of our paper is to propose some aspects of these investigations and this methodological reflection: a) the structure of the voice in a differentiated form ('light' and 'complex'); b) the treatment of emerging positions from the statistical analysis tools of the corpus; c) the lemmatization of compound words in the face of the morphological polymorph emerging from the diachronic depth of the corpus; d) the correct balance between the examples mentioned in the voice and the possibility of a direct interrelation with the database].I documenti in FLORE sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.