Le nuove tecnologie semantiche rappresentano una sfida, un’opportunità ed un rischio per la statistica ufficiale: consentono infatti di gestire le informazioni quantitative con una potenza elaborativa inedita, ma rischiano di generare sistemi informativi molto lontani da quegli standard di qualità che sono indispensabili per l’analisi statistica. In questo lavoro si è ripensato al riuso statistico delle fonti amministrative alla luce delle potenzialità che potrebbero venire da una consapevole integrazione con la tecnologia semantica. Si è pensato cioè ad una strategia che consenta di contenere il grande spreco di memoria pubblica dovuto alla difficoltà di integrazione delle fonti: sistemi informativi adeguati alla gestione di problemi e servizi risultano inservibili se ripensati per il riuso dei loro dati. Naturalmente esistono e sono sempre più diffuse le metodologie big data, ma difficilmente con questi approcci si può arrivare al dettaglio informativo e alla qualità e precisione di misura necessari quando si devono affrontare problemi di grande specificità e delicatezza, come tipicamente sono quelli sanitari o quelli legati alle condizioni sociali e di lavoro. Per questo ci si è concentrati su come usare queste tecnologie per supportare tutto il processo di generazione degli archivi, fin dal momento della loro concettualizzazione. Al di là dei risultati di fattibilità tecnica, discussi nel caso di studio, è interessante aver evidenziato degli inediti ambiti di presenza delle agenzie statistiche: il presidio del linguaggio e delle concettualizzazioni che, se adottate il modo ampio, consentirebbero una ben diversa qualità delle fonti amministrative. Si tratta di una integrazione che non va solo nel senso di una più vasta diffusione delle codifiche ufficiali, ma che supporta anche il percorso inverso: quello del riconoscimento delle modalità di denotazione degli esperti dei diversi domini, per conoscerli, apprenderli, integrarli e diffonderli ufficialmente. La possibilità di connotare ogni concetto di un suo identificativo ufficiale memorizzato su internet, la scelta di far adottare queste modalità agli attori sociali ed economici che agiscono sui territori e nei processi, la costituzione di grandi testi interpretabili automaticamente, sposta gli usuali orizzonti di chi si occupa di sistemi informativi statistici: processi come quelli di linkage o di test delle condizione di rispetto della privacy assumono una scala e una problematicità di ordine estremamente maggiore e nuovo per la comunità statistica.
Il ruolo di approcci e tecnologie semantiche nella predisposizione di sistemi informativi statistici a supporto delle decisioni in ambienti complessi / Adham Kahlawi. - (2016).
Il ruolo di approcci e tecnologie semantiche nella predisposizione di sistemi informativi statistici a supporto delle decisioni in ambienti complessi
KAHLAWI, ADHAM
2016
Abstract
Le nuove tecnologie semantiche rappresentano una sfida, un’opportunità ed un rischio per la statistica ufficiale: consentono infatti di gestire le informazioni quantitative con una potenza elaborativa inedita, ma rischiano di generare sistemi informativi molto lontani da quegli standard di qualità che sono indispensabili per l’analisi statistica. In questo lavoro si è ripensato al riuso statistico delle fonti amministrative alla luce delle potenzialità che potrebbero venire da una consapevole integrazione con la tecnologia semantica. Si è pensato cioè ad una strategia che consenta di contenere il grande spreco di memoria pubblica dovuto alla difficoltà di integrazione delle fonti: sistemi informativi adeguati alla gestione di problemi e servizi risultano inservibili se ripensati per il riuso dei loro dati. Naturalmente esistono e sono sempre più diffuse le metodologie big data, ma difficilmente con questi approcci si può arrivare al dettaglio informativo e alla qualità e precisione di misura necessari quando si devono affrontare problemi di grande specificità e delicatezza, come tipicamente sono quelli sanitari o quelli legati alle condizioni sociali e di lavoro. Per questo ci si è concentrati su come usare queste tecnologie per supportare tutto il processo di generazione degli archivi, fin dal momento della loro concettualizzazione. Al di là dei risultati di fattibilità tecnica, discussi nel caso di studio, è interessante aver evidenziato degli inediti ambiti di presenza delle agenzie statistiche: il presidio del linguaggio e delle concettualizzazioni che, se adottate il modo ampio, consentirebbero una ben diversa qualità delle fonti amministrative. Si tratta di una integrazione che non va solo nel senso di una più vasta diffusione delle codifiche ufficiali, ma che supporta anche il percorso inverso: quello del riconoscimento delle modalità di denotazione degli esperti dei diversi domini, per conoscerli, apprenderli, integrarli e diffonderli ufficialmente. La possibilità di connotare ogni concetto di un suo identificativo ufficiale memorizzato su internet, la scelta di far adottare queste modalità agli attori sociali ed economici che agiscono sui territori e nei processi, la costituzione di grandi testi interpretabili automaticamente, sposta gli usuali orizzonti di chi si occupa di sistemi informativi statistici: processi come quelli di linkage o di test delle condizione di rispetto della privacy assumono una scala e una problematicità di ordine estremamente maggiore e nuovo per la comunità statistica.File | Dimensione | Formato | |
---|---|---|---|
tesi di dottorato (Adham Kahlawi).pdf
accesso aperto
Descrizione: sistemi informativi statistici e semantic web
Tipologia:
Tesi di dottorato
Licenza:
Open Access
Dimensione
3.39 MB
Formato
Adobe PDF
|
3.39 MB | Adobe PDF |
I documenti in FLORE sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.