For a Human-Centered AI

Di cosa si è discusso in Italia su Twitter durante la prima fase della pandemia Covid-19?

9 Giugno 2020

I ricercatori della Fondazione Bruno Kessler di Trento hanno analizzato milioni di tweet postati tra il 15 febbraio e il 12 maggio 2020 e li hanno confrontati con quelli del 2019

Di cosa hanno si è discusso in Italia su Twitter durante la prima fase della pandemia Covid-19?

I ricercatori della Fondazione Bruno Kessler di Trento hanno analizzato milioni di tweet geolocalizzati, ovvero quei tweet in cui l’utente ha volontariamente deciso di condividere la propria posizione, postati tra il 15 febbraio e 12 maggio 2020, e hanno misurato sia la frequenza degli hashtag sia i concetti presenti nei messaggi. Per fare un confronto, la stessa analisi è stata poi effettuata sui tweet geolocalizzati postati nello stesso periodo del 2019.

I risultati sono stati quindi suddivisi per regione e rappresentati graficamente tramite delle tag cloud in modo da evidenziare le principali parole chiave. I dati sono stati anonimizzati e aggregati a livello regionale, garantendo il rispetto delle norme vigenti in materia di privacy.

“L’attività di ricerca necessaria per questa analisi”, spiega  Manlio De Domenico, fisico dei sistemi complessi e responsabile dell’Unità CoMuNe Lab alla FBK, “è stata effettuata nell’ambito del progetto bandiera Computational Human Behavior (CHuB). Il progetto si propone di capire meglio i comportamenti collettivi che possono essere misurati sui social media, come Twitter. Lo scopo è quello di avere una lente sul territorio basata sui big data, che permetta di capire meglio le problematiche dei cittadini e la loro risposta alle scelte dei decisori politici. E’ in questo contesto che CoMuNe Lab, afferente alla linea di ricerca Digital Society, raccoglie dati su tutto il territorio italiano dagli inizi del 2019. I messaggi pubblici considerati sono quelli che contengono informazione di geolocalizzazione autorizzata dall’utente e vengono successivamente anonimizzati ed aggregati a livello di regione, per garantire il rispetto della privacy individuale. I dati considerati sono quelli relativi all’intera discussione pubblica, quindi non soltanto legata alla recente evoluzione della pandemia di COVID-19”.

Lo studio riporta il risultato di due analisi distinte: da un lato la frequenza degli hashtag utilizzati, espressione della volontà individuale di collocare il proprio tweet nell’ambito dell’attenzione collettiva su un determinato argomento; dall’altro, la frequenza dei concetti utilizzati per esprimere il proprio pensiero. Nella seconda analisi, sono state utilizzate tecniche di machine learning per automatizzare il processo e analizzare le centinaia di migliaia di tweet postati tra febbraio e maggio, rispettivamente nel 2019 e nel 2020.

Le rappresentazioni grafiche dello studio suddivise per regioni sono visibili qui: https://comunelab.fbk.eu/covid19_italy.php


Autore/i