Le nuove tecnologie semantiche rappresentano una sfida, un’opportunità ed un rischio per la statistica ufficiale: consentono infatti di gestire le informazioni quantitative con una potenza elaborativa inedita, ma rischiano di generare sistemi informativi molto lontani da quegli standard di qualità che sono indispensabili per l’analisi statistica. In questo lavoro si è ripensato al riuso statistico delle fonti amministrative alla luce delle potenzialità che potrebbero venire da una consapevole integrazione con la tecnologia semantica. Si è pensato cioè ad una strategia che consenta di contenere il grande spreco di memoria pubblica dovuto alla difficoltà di integrazione delle fonti: sistemi informativi adeguati alla gestione di problemi e servizi risultano inservibili se ripensati per il riuso dei loro dati. Naturalmente esistono e sono sempre più diffuse le metodologie big data, ma difficilmente con questi approcci si può arrivare al dettaglio informativo e alla qualità e precisione di misura necessari quando si devono affrontare problemi di grande specificità e delicatezza, come tipicamente sono quelli sanitari o quelli legati alle condizioni sociali e di lavoro. Per questo ci si è concentrati su come usare queste tecnologie per supportare tutto il processo di generazione degli archivi, fin dal momento della loro concettualizzazione. Al di là dei risultati di fattibilità tecnica, discussi nel caso di studio, è interessante aver evidenziato degli inediti ambiti di presenza delle agenzie statistiche: il presidio del linguaggio e delle concettualizzazioni che, se adottate il modo ampio, consentirebbero una ben diversa qualità delle fonti amministrative. Si tratta di una integrazione che non va solo nel senso di una più vasta diffusione delle codifiche ufficiali, ma che supporta anche il percorso inverso: quello del riconoscimento delle modalità di denotazione degli esperti dei diversi domini, per conoscerli, apprenderli, integrarli e diffonderli ufficialmente. La possibilità di connotare ogni concetto di un suo identificativo ufficiale memorizzato su internet, la scelta di far adottare queste modalità agli attori sociali ed economici che agiscono sui territori e nei processi, la costituzione di grandi testi interpretabili automaticamente, sposta gli usuali orizzonti di chi si occupa di sistemi informativi statistici: processi come quelli di linkage o di test delle condizione di rispetto della privacy assumono una scala e una problematicità di ordine estremamente maggiore e nuovo per la comunità statistica.

Il ruolo di approcci e tecnologie semantiche nella predisposizione di sistemi informativi statistici a supporto delle decisioni in ambienti complessi / Adham Kahlawi. - (2016).

Il ruolo di approcci e tecnologie semantiche nella predisposizione di sistemi informativi statistici a supporto delle decisioni in ambienti complessi

KAHLAWI, ADHAM
2016

Abstract

Le nuove tecnologie semantiche rappresentano una sfida, un’opportunità ed un rischio per la statistica ufficiale: consentono infatti di gestire le informazioni quantitative con una potenza elaborativa inedita, ma rischiano di generare sistemi informativi molto lontani da quegli standard di qualità che sono indispensabili per l’analisi statistica. In questo lavoro si è ripensato al riuso statistico delle fonti amministrative alla luce delle potenzialità che potrebbero venire da una consapevole integrazione con la tecnologia semantica. Si è pensato cioè ad una strategia che consenta di contenere il grande spreco di memoria pubblica dovuto alla difficoltà di integrazione delle fonti: sistemi informativi adeguati alla gestione di problemi e servizi risultano inservibili se ripensati per il riuso dei loro dati. Naturalmente esistono e sono sempre più diffuse le metodologie big data, ma difficilmente con questi approcci si può arrivare al dettaglio informativo e alla qualità e precisione di misura necessari quando si devono affrontare problemi di grande specificità e delicatezza, come tipicamente sono quelli sanitari o quelli legati alle condizioni sociali e di lavoro. Per questo ci si è concentrati su come usare queste tecnologie per supportare tutto il processo di generazione degli archivi, fin dal momento della loro concettualizzazione. Al di là dei risultati di fattibilità tecnica, discussi nel caso di studio, è interessante aver evidenziato degli inediti ambiti di presenza delle agenzie statistiche: il presidio del linguaggio e delle concettualizzazioni che, se adottate il modo ampio, consentirebbero una ben diversa qualità delle fonti amministrative. Si tratta di una integrazione che non va solo nel senso di una più vasta diffusione delle codifiche ufficiali, ma che supporta anche il percorso inverso: quello del riconoscimento delle modalità di denotazione degli esperti dei diversi domini, per conoscerli, apprenderli, integrarli e diffonderli ufficialmente. La possibilità di connotare ogni concetto di un suo identificativo ufficiale memorizzato su internet, la scelta di far adottare queste modalità agli attori sociali ed economici che agiscono sui territori e nei processi, la costituzione di grandi testi interpretabili automaticamente, sposta gli usuali orizzonti di chi si occupa di sistemi informativi statistici: processi come quelli di linkage o di test delle condizione di rispetto della privacy assumono una scala e una problematicità di ordine estremamente maggiore e nuovo per la comunità statistica.
2016
Martelli Cristina
SIRIA
Adham Kahlawi
File in questo prodotto:
File Dimensione Formato  
tesi di dottorato (Adham Kahlawi).pdf

accesso aperto

Descrizione: sistemi informativi statistici e semantic web
Tipologia: Tesi di dottorato
Licenza: Open Access
Dimensione 3.39 MB
Formato Adobe PDF
3.39 MB Adobe PDF

I documenti in FLORE sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificatore per citare o creare un link a questa risorsa: https://hdl.handle.net/2158/1036349
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact