di Anna Gigli e Silvia Francisci.
Mai come in questa pandemia di Covid-19 abbiamo realizzato quanto i numeri siano importanti, sia per la descrizione che per la comprensione e la gestione del fenomeno: la raccolta dei dati, la produzione di indicatori appropriati, la messa a punto di modelli previsionali sono attività che concorrono a descrivere lo stato del contagio, il suo impatto sulla salute della popolazione coinvolta e a mettere a punto opportune strategie di contenimento. Per fare tutto questo è fondamentale che i dati siano raccolti in maniera sistematica e tale da garantire la completezza, la qualità e la rappresentatività dell’informazione. A tale scopo servono dei sistemi di sorveglianza che siano disponibili e operativi nel continuo.
Guardare indietro o guardare avanti?
La tempistica per l’acquisizione dei dati sui nuovi casi segue necessariamente la dinamica del contagio: in particolare, il tempo di incubazione tra il contagio e l’eventuale sviluppo dei sintomi si stima mediamente tra i 7 e i 10 giorni, quello che intercorre tra la manifestazione dei sintomi, l’esecuzione del tampone, l’eventuale conferma di positività e l’inserimento del nuovo caso nel sistema di sorveglianza integrata gestito dall’Istituto Superiore di Sanità (ISS) richiede mediamente ulteriori 3-5 giorni. Complessivamente quindi i soggetti positivi comunicati giornalmente dal Ministero della Salute sono stati contagiati in media due settimane prima, a meno di ulteriori ritardi di gestione dell’attività di diagnosi e di notifica. Tenuto conto di questa tempistica si può concludere che guardare i numeri quotidiani della pandemia è un po’ come osservare la realtà dallo specchietto retrovisore.
Per guardare in avanti e riuscire a identificare e calibrare tempestivamente le misure di contenimento del contagio occorre fare ricorso ai modelli previsionali. Tre sono gli ingredienti fondamentali di un modello previsionale: i dati raccolti, che debbono essere il più possibile aggiornati e completi; il modello matematico-statistico, che dovremo scegliere in funzione del quesito investigativo cui vogliamo dare risposta (non esistono modelli validi “per tutte le stagioni”), tenuto conto delle ipotesi su cui è fondato; l’incertezza statistica, che è una componente intrinseca e ineliminabile delle stime ottenute dal modello, ma è misurabile e di cui è necessario tener conto nell’interpretazione dei risultati e nel loro utilizzo ai fini di gestione del contagio.
Perché condividere i dati?
Per quanto riguarda i dati, è fondamentale che siano disponibili in tempi rapidi, dal momento che il processo di diffusione di una pandemia è veloce e richiede una risposta altrettanto veloce da parte della società e, in particolare, della comunità scientifica. Per chi raccoglie e analizza i dati, lavorare velocemente significa raggiungere un compromesso tra l’accuratezza dell’informazione e la tempestività con cui viene trasmessa al decisore politico: un dato inaccurato mina la fondatezza del messaggio che se ne può ricavare e rischia di compromettere l’efficacia delle misure di intervento.
La condivisione del dato all’interno della comunità scientifica è di fondamentale importanza, sia perché garantisce un maggior controllo dell’informazione raccolta, sia perché favorisce risposte tempestive e di qualità ad un fenomeno per sua natura complesso e nuovo. Secondo i principi dell’Open Data – e nel rispetto del diritto individuale alla privacy – i dati prodotti con finanziamento pubblico devono ritornare ai contribuenti, e alla comunità in generale, sotto forma di informazioni accessibili (ovvero non di formato proprietario come pdf, jpg o simili), non aggregati e di buona qualità, al fine di poterli utilizzare più volte per analisi e approfondimenti. Questi requisiti divengono ancora più rilevanti in ambito scientifico, al fine di massimizzare il beneficio che la comunità può trarre dalle ricerche scientifiche.
La richiesta di accessibilità dei dati e di trasparenza nella loro gestione è stata manifestata dalla comunità scientifica italiana, sin dall’inizio della pandemia.
In un documento della Commissione Covid-19 del 1 giugno 2020 l’Accademia dei Lincei ribadisce la necessità che i dati originali siano resi pubblici per poter coinvolgere l’intera comunità scientifica nel governo dell’epidemia e permettere a gruppi diversi di scienziati di analizzarli e arrivare a conclusioni condivise. La mancanza di condivisione dei dati e di trasparenza nella loro gestione – sostengono – mina la credibilità della ricerca scientifica, lasciando spazio a critiche e dubbi e indebolisce la posizione delle istituzioni.
Ad ottobre 2020, nell’ultimo di numerosi appelli, l’Associazione Italiana di Epidemiologia si è rivolta ai decisori politici chiedendo trasparenza nell’individuazione degli indicatori che sono alla base delle decisioni intraprese dal Governo nazionale e dalle regioni.
A dicembre 2020 la Società Italiana di Statistica (SIS) ha promosso una raccolta di firme intorno ad una lettera aperta rivolta ai decisori politici, nella quale si afferma che “a questo punto dell’evoluzione della pandemia, quanto reso disponibile dalla Protezione Civile non sia più sufficiente per rendere trasparente il meccanismo decisionale del governo e la comprensione scientifica dell’evoluzione della pandemia stessa.”
Infine, la campagna #datiBeneComune, lanciata nel novembre 2020 sotto forma di una petizione promossa da 165 organizzazioni (tra cui SIS e IRPPS-CNR), ha raccolto oltre 46 mila adesioni alla richiesta di dati pubblici, disaggregati, continuamente aggiornati, ben documentati e facilmente accessibili a ricercatori, decisori, media e cittadini.
A livello internazionale, un primo spunto di riflessione sui benefici della condivisione delle informazioni con il pubblico è stato lanciato ai decisori politici all’inizio della pandemia dallo storico israeliano Harari, che in un articolo apparso ad aprile 2020 sul Financial Times e tradotto su Internazionale affermava:
“Se potessi accedere a statistiche affidabili sulla diffusione del coronavirus e analizzarle, sarei in grado di giudicare se il governo mi sta dicendo la verità e se sta adottando i provvedimenti giusti contro l’epidemia. Ogni volta che ci parlano di sorveglianza, non dimentichiamoci che la stessa tecnologia può essere usata non solo dai governi per controllare gli individui, ma anche dagli individui per controllare i governi. L’epidemia del nuovo coronavirus è quindi un importante test di cittadinanza. Nei prossimi giorni ognuno di noi dovrebbe scegliere di fidarsi dei dati scientifici e degli esperti piuttosto che di infondate teorie del complotto e di politici che fanno i loro interessi.”
Come vengono comunicati i numeri della pandemia in Italia?
Quotidianamente sul sito del Ministero della Salute viene pubblicato un bollettino riepilogativo che contiene il numero aggregato di casi attualmente positivi, di ricoverati, guariti, deceduti, tamponi positivi. Questi dati sono forniti per ciascuna regione come numeri assoluti e vengono quotidianamente menzionati nei notiziari alla TV e alla radio e ripresi dai quotidiani. Sarebbe molto più informativo (e responsabilizzante) fornire i tassi di incidenza regionali, dividendo i numeri assoluti per la popolazione residente, così da permettere un confronto tra le regioni (a titolo esemplificativo, la Lombardia ha 10 milioni di residenti, la Campania o il Lazio ne hanno 5.8 milioni), come nei bollettini settimanali dell’ISS, ad esempio: Bollettino-sorveglianza-integrata-COVID-19_17-febbraio-2021
E come vengono comunicati i numeri della pandemia negli altri paesi?
L’equivalente del bollettino pubblicato dall’ISS è in Germania il report giornaliero del Robert Koch-Institut (RKI), che descrive l’andamento della pandemia su tutto il territorio nazionale. In aggiunta al numero di casi e decessi per 100,000 abitanti, il RKI pubblica dettagli dei contagi per settore di attività (lavoratori in impianti di lavorazione di carni o in ristoranti, bar etc.) e luogo del contagio (residenze per anziani, per disabili o per rifugiati, prigioni, scuole/centri estivi, ospedali) e riporta la situazione nelle terapie intensive (ricoverati, dimessi, morti, variazione dal giorno precedente). Con cadenza settimanale il report è corredato da approfondimenti tematici.
Un altro esempio di comunicazione completa ed efficace è quella curata dall’Office for National Statistics (l’analogo britannico dell’ISTAT) e da varie Università e centri di ricerca inglesi, sui risultati di un’indagine di siero prevalenza che vengono aggiornati da un bollettino con cadenza settimanale. L’indagine, lanciata ad aprile 2020 in Inghilterra e via via allargata fino a coprire tutto il Regno Unito, raccoglie dati di un tampone e un prelievo di sangue effettuati a domicilio su un campione rappresentativo della popolazione, ed è attualmente ancora in corso. Il bollettino settimanale riporta varie informazioni, grafici e tabelle sull’andamento dell’epidemia. La comunicazione dei risultati dell’indagine è particolarmente curata: tutti i dati che contribuiscono a creare grafici e tabelle sono scaricabili (e quindi riproducibili da chiunque abbia gli strumenti per farlo); ogni stima è affiancata da una misura della sua incertezza statistica; infine, l’appendice metodologica è corredata da una sezione che descrive le diverse fonti di incertezza, dal metodo di campionamento, all’affidabilità dei test (falsi positivi / falsi negativi),alla qualità delle interviste.
Cosa si può fare con i dati accessibili?
In parte le richieste sull’accessibilità dei dati in Italia sono state esaudite: il repository Covid-19 Opendata Vaccini rende accessibili i dati di consegna e somministrazione nelle varie regioni Italiane dei vaccini anti COVID-19. Sulla base di questi dati è possibile fare analisi, proiezioni, stime, come nel caso dell’applicazione sperimentale “Vaccini per tutti” creata dall’associazione onData APS nell’ambito della campagna #datiBeneComune, che permette di stimare i tempi di avanzamento della campagna di vaccinazione in Italia: un esempio di cosa si può fare quando i dati istituzionali sono aperti.
In conclusione, passata la fase iniziale emergenziale c’è ora la necessità che ulteriori informazioni vengano messe a disposizione per poter fare indagini sociali e demografiche, volte a misurare i costi sociali delle scelte fatte e di quelle da intraprendere. Pensiamo ad esempio all’impatto sociale ed economico derivante dalla chiusura delle scuole, oppure all’impatto dell’emergenza sull’assistenza sanitaria dedicata ad altre malattie (gli screening oncologici, per dirne una, sono stati sospesi), o ancora all’impatto dell’eccesso di mortalità dovuto al Covid-19 sulla speranza di vita alla nascita, o sulla fecondità. Per fare tutto ciò servono i dati.
Per approfondimenti:
I NUMERI DELLA PANDEMIA: ISTRUZIONI (E CAUTELE) PER L’USO – ANNA GIGLI, SILVIA FRANCISCI, in Migrazioni di virus. Numeri e linguaggi, a cura di C. Bonifazi, M.E. Cadeddu, C. Marras, Collana PluriMi, vol. II, Cnr Edizioni, https://www.cnr.it/it/plurimi (in corso di pubblicazione)