In questo contributo viene presentato un avanzamento dei lavori relativi al progetto di annotazione semiautomatica di corpora non standard, con particolare riferimento alla applicazione al Corpus di parlato patologico prodotto da soggetti schizofrenici (corpus CIPPS). Il progetto è funzionale all’analisi del lessico sia dal punto di vista delle classi di parole, sia per quanto riguarda la presenza e incidenza di altri specifici fenomeni del parlato che, nella dimensione non normofasica, possono presentarsi con maggiore incidenza (ad es. marcatori discorsivi, disfluenze in genere). Un aspetto di particolare problematicità è rappresentato inoltre dalla trascrizione del parlato dialettale alternato allo standard. L’obiettivo del progetto resta la realizzazione di uno strumento efficace per l’etichettatura multilivello, concepito per il corpus CIPPS ma adattabile ad altre tipologie di corpora non–standard, e in grado di automatizzare il più possibile le funzioni di annotazione.

Ancora sull’annotazione di corpora ‘speciali’ / Alessandro Panunzi, Lorenzo Gregori, Francesca Maria Dovetto, Assunta Sorrentino, Simona Trillocco. - STAMPA. - (2023), pp. 377-407.

Ancora sull’annotazione di corpora ‘speciali’

Alessandro Panunzi
;
Lorenzo Gregori;Simona Trillocco
2023

Abstract

In questo contributo viene presentato un avanzamento dei lavori relativi al progetto di annotazione semiautomatica di corpora non standard, con particolare riferimento alla applicazione al Corpus di parlato patologico prodotto da soggetti schizofrenici (corpus CIPPS). Il progetto è funzionale all’analisi del lessico sia dal punto di vista delle classi di parole, sia per quanto riguarda la presenza e incidenza di altri specifici fenomeni del parlato che, nella dimensione non normofasica, possono presentarsi con maggiore incidenza (ad es. marcatori discorsivi, disfluenze in genere). Un aspetto di particolare problematicità è rappresentato inoltre dalla trascrizione del parlato dialettale alternato allo standard. L’obiettivo del progetto resta la realizzazione di uno strumento efficace per l’etichettatura multilivello, concepito per il corpus CIPPS ma adattabile ad altre tipologie di corpora non–standard, e in grado di automatizzare il più possibile le funzioni di annotazione.
2023
979-12-218-1165-0
Lingua e patologia. Parole dentro parole fuori
377
407
Alessandro Panunzi, Lorenzo Gregori, Francesca Maria Dovetto, Assunta Sorrentino, Simona Trillocco
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in FLORE sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificatore per citare o creare un link a questa risorsa: https://hdl.handle.net/2158/1406852
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact