Categorie
cronaca

Nella babele dei numeri sul Coronavirus: ecco perché non è mai come sembra

Un collage di dati disomogenei per data e criteri con cui vengono raccolti e diffusi …

ROMA – I numeri sull’andamento del Covid che ogni pomeriggio attendiamo con trepidazione per provare a valutare il nostro destino, frutto di un lavoro che coinvolge migliaia di persone in tutta Italia, sono un tale collage di dati disomogenei per provenienza, per data e per criteri che la maggior parte dei commenti e dei giudizi che ne traiamo sono inevitabilmente inesatti. Il “numero dei tamponi effettuato ieri”, per esempio, è un dato che in realtà non esiste: si tratta piuttosto del numero di tamponi per i quali – dopo ore o giorni – è finalmente arrivato il risultato. Abbiamo chiesto a Patrizio Pezzotti, epidemiologo e responsabile della Sorveglianza Covid-19 dell’Istituto superiore di sanità, di guidarci nella giungla dei numeri spiegandoci come vengano raccolti, processati e diffusi, e quali e quanto siano attendibili.

Casi certi ma non ufficiali, ecco perché

“Noi partiamo dalla definizione di ‘caso internazionale’ basata sulla diagnosi microbiologica. Non potendo stanare il virus direttamente dentro i polmoni, siamo costretti a ricercarlo nelle alte vie respiratorie, nei tessuti che sono nella nostra gola, nella zona rinofaringea. Per identificalo si pratica il tampone, e il nostro lavoro parte da qui: dal ‘caso confermato’, secondo la definizione europea. Purtroppo il virus non ha spesso sintomi così evidenti e costanti da permetterci un’altra via per catalogare un caso confermato: è una scelta di accuratezza ma anche un difetto, perché comporta che si debba fare necessariamente il tampone per arrivare a una diagnosi da notificare”.

Per questo non rientrano nei numeri e nelle statistiche diffuse sul Covid tutti i casi di quelle persone, come molti familiari di pazienti ufficialmente covid, che non hanno mai potuto fare il tampone pur essendo stati a contatto con un malato, e pur avendo avuto sintomi evidenti come la febbre e la perdita di olfatto e gusto. Per i medico di famiglia magari non ci sono dubbi, ma non finirà nelle statistiche Covid.

Dati raccolti e comunicati al telefono

“Il tampone si traduce in due tipi di numeri: uno, aggregato, va ad alimentare il flusso dei dati diffusi prima dalla Protezione civile e ora dal ministero della Salute e dall’Iss. Ogni giorno le Regioni devono inviare al ministero della Salute i dati raccolti, e lo fanno attraverso una piattaforma telematica, un sito web con user e password: ogni Regione ha un suo referente per la ‘Sorveglianza Covid’, che provvede a raccogliere i dati. Ogni Regione ha le sue modalità e ogni referente lavora a modo suo: chi raccoglie i dati al telefono da ogni laboratorio, chi ha un sistema totalmente informatizzato, chi fa un po’ e un po’. Ogni giorno vengono così inviate le nuove diagnosi effettuate”. E dove la raccolta è un passaparola telefonico il margine di errore è ovviamente elevato.

I tamponi effettuati non sono quelli del giorno prima

“Ogni giorno vengono inviate le nuove diagnosi di tampone molecolare positivo ma anche il numero di tamponi effettuati in persone non precedentemente Covid, cioè quelli fatti per verifica o per certificare la guarigione. Le Regioni comunicano anche quotidianamente il numero di persone ricoverate ogni giorno, e quelle presenti in terapia intensiva”.
Sono dati aggregati, trasferiti dalle regioni ogni volta che vengono raccolti aggiornamenti, non sempre puntuali. I risultati dei tamponi, per esempio, vengono diffusi quando arrivano, e “il numero dei tamponi effettuati è in realtà il numero dei tamponi di cui quel giorno si è avuto il risultato”. Per questo il dato del rapporto tra “tamponi effettuati” e “nuovi positivi” è corretto in sé, perché “non vengono conteggiati i tamponi di controllo”, ma non rispecchia l’andamento giornaliero perché mischia risultati relativi a giorni anche molto differenti.  

I dati certi ci sono, ma non vengono diffusi

“Parallelamente per le stesse persone c’è un secondo flusso di dati: sono i casi individuali, quelli che gestiamo noi in Istituto. Per ogni persona ci sono molti più dati, come l’età e il sesso, il comune di residenza o domicilio, quando sono iniziati i sintomi, la data esatta della diagnosi e altre informazioni di qualità varia. Chiediamo per esempio dove si è infettato, se presumibilmente in famiglia o in Rsa; chiediamo se è un operatore sanitario e pochi altri dettagli. Ciascuno viene poi seguito nella sua malattia: se viene ricoverato ne registriamo la data, se va in terapia intensiva lo stesso, e registriamo se la malattia si conclude con la guarigione o, purtroppo, con la morte. Sono dati più precisi ma complessi, raccolti da migliaia di persone sul territorio. Persone che fanno riferimento a ogni regione, noi abbiamo costruito la piattaforma tecnologica in cui gli operatori possono inserire i dati. Molte regioni hanno loro un sistema informatico gestionale e fanno un upload massivo: c’è un tasto per caricare il file, omogeneo al nostro sistema. Ognuno dei due flussi, quello aggregato gestito dalle regioni e quello puntuale dell’Iss, hanno pregi e difetti: il primo è tempestivo, giornaliero, ma molto generico; il secondo ha dati più dettagliati ma è più lento”. Il dato che attendiamo ogni pomeriggio è solo il primo.

Doppi positivi? Ci pensa l’algoritmo

“Nel flusso dei dati la seconda positività non viene comunicata. C’è un algoritmo che scarta le conferme di positività. Noi sui dati inviati controlliamo continuamente se la persona è già stata segnalata prima, perché a volte l’errore può capitare: per esempio un errore di battitura su un nome può generare un secondo positivo. E le regioni quando caricano i dati devono verificare se la persona ha un identificativo di assistito regionale. Il controllo per evitare le doppie segnalazioni c’è sia alla fonte sia da parte nostra”.

La babele dei dati regionali

“Il paziente viene seguito durante la sua malattia, e l’Asl controlla l’esito. Sui dati aggregati le Regioni hanno creato i loro sistemi di classificazione e aggiornamento dei flussi. Ogni regione notifica poi i suoi dati. Ogni regione fa come vuole, organizzandosi come crede per la comunicazione. Per questo la variabilità giornaliera non riflette la situazione reale nel dettaglio. Diverso è se si prende il periodo di una settimana. Tra domenica e lunedì le variazioni al ribasso dei numeri sono legate al sistema di notifica. Per molti dati puntuali come l’andamento dei ricoveri in terapia intensiva, poi, raccolta e comunicazione dovrebbero essere giornaliere ma molto dipende dal momento in cui i dati vengono raccolti dalle regioni: c’è chi lo fa alle 10, chi alle 12 e chi alle 14. I dati giornalieri sono sempre poco affidabili. Quelli sui decessi, per esempio, ci hanno dato la prova del problema: sui dati aggregati vediamo spesso una forte oscillazione tra giorni diversi, sui dati puntuali che gestiamo noi e che contengono la data esatta della morte l’oscillazione è molto inferiore e quasi inesistente. Se però si guarda il dato settimanale il dato torna”.

Il rapporto tra tamponi e positivi è poco significativo

“Il rapporto tra tamponi effettuati e positivi accertati non credo sia fondamentale: è discutibile, potrebbe esserci una regione che lavora male e fa tamponi a caso e ha un rapporto basso di positivi per tamponi effettuati. E’ più corretto semmai il rapporto tra i temponi effettuati e popolazione residente, ma è un dato che rivela l’efficienza del sistema di controllo e non l’andamento del virus. Sicuramente è più significativo il rapporto tra sintomatici e casi totali: quando sale molto vuol dire che l’offerta di tamponi è in sofferenza”, cioè vuol dire che riescono a farne pochi e che il numero dei reali positivi potrebbe essere molto più elevato di quello che appare.

Contact tracing e interessi politici

Secondo Pezzotti, il vero punto di svolta sarebbe riportare al centro l’efficacia del contact tracing e aumentare moltissimo il numero dei tamponi: “Se tutti noi potessimo farlo tutti i giorni come nel calcio sarebbe l’ideale, eppure anche lì abbiamo visto che non funziona benissimo. L’ideale sarebbe comunque arrivare a un test individuale che ognuno possa fare tutte le mattine quando si alza: se sono negativo ok, esco, altrimenti resto a casa in isolamento. Ma è più facile finisca prima l’epidemia”.

Nel frattempo, il sistema è inquinato anche dalla politica regionale, che ha interesse a tirare i dati dalla sua parte evidenziando o nascondendo la portata dell’epidemia: “Servirebbe un sistema indipendente dalla politica regionale che può cercare di aggiustare i dati quando le fa comodo. Se mi metto a fare campioni a raffica su piccole comunità in cui so che non ci sono positivi altero la realtà. Comunque, anche se non escludo che ci possa essere qualcosa di non corretto nei dati, in generale i dati ricevuti sono abbastanza verosimili rispetto a quello che ci aspettiamo, e a quello che poi troviamo con l’analisi puntuale”.

Crediti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *