In questo contributo viene presentato un avanzamento dei lavori relativi al progetto di annotazione semiautomatica di corpora non standard, con particolare riferimento alla applicazione al Corpus di parlato patologico prodotto da soggetti schizofrenici (corpus CIPPS). Il progetto è funzionale all’analisi del lessico sia dal punto di vista delle classi di parole, sia per quanto riguarda la presenza e incidenza di altri specifici fenomeni del parlato che, nella dimensione non normofasica, possono presentarsi con maggiore incidenza (ad es. marcatori discorsivi, disfluenze in genere). Un aspetto di particolare problematicità è rappresentato inoltre dalla trascrizione del parlato dialettale alternato allo standard. L’obiettivo del progetto resta la realizzazione di uno strumento efficace per l’etichettatura multilivello, concepito per il corpus CIPPS ma adattabile ad altre tipologie di corpora non–standard, e in grado di automatizzare il più possibile le funzioni di annotazione.
Ancora sull’annotazione di corpora ‘speciali’ / Alessandro Panunzi, Lorenzo Gregori, Francesca Maria Dovetto, Assunta Sorrentino, Simona Trillocco. - STAMPA. - (2023), pp. 377-407.
Ancora sull’annotazione di corpora ‘speciali’
Alessandro Panunzi
;Lorenzo Gregori;Simona Trillocco
2023
Abstract
In questo contributo viene presentato un avanzamento dei lavori relativi al progetto di annotazione semiautomatica di corpora non standard, con particolare riferimento alla applicazione al Corpus di parlato patologico prodotto da soggetti schizofrenici (corpus CIPPS). Il progetto è funzionale all’analisi del lessico sia dal punto di vista delle classi di parole, sia per quanto riguarda la presenza e incidenza di altri specifici fenomeni del parlato che, nella dimensione non normofasica, possono presentarsi con maggiore incidenza (ad es. marcatori discorsivi, disfluenze in genere). Un aspetto di particolare problematicità è rappresentato inoltre dalla trascrizione del parlato dialettale alternato allo standard. L’obiettivo del progetto resta la realizzazione di uno strumento efficace per l’etichettatura multilivello, concepito per il corpus CIPPS ma adattabile ad altre tipologie di corpora non–standard, e in grado di automatizzare il più possibile le funzioni di annotazione.I documenti in FLORE sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.