attualitàNotizie di Cisternino

La statistica una scienza quasi sconosciuta

La dott.ssa Patrizia Soleti ci aiuta a capire cos’è

Nostro malgrado in questi ultimi tempi, a causa del COVID-19, abbiamo dovuto confrontarci con la statistica, una scienza che per la maggior parte di noi non va oltre la semplificazione che il poeta Trilussa fa attraverso una sua celebre e simpatica poesia che vi invito a cercare e a leggere, se ancora non la conosceste. Per questo motivo abbiamo cercato di capirne qualcosa in più affidandoci ad un’esperta cistranese. Patrizia  Soleti.

Laurea in scienze statistiche con il massimo dei voti, dottorato di ricerca, diverse pubblicazioni scientifiche e collaborazioni con la facoltà di statistica dell’università di Bari, la dottoressa Soleti ha risposto ad alcune domande che abbiamo voluto porle.

Dottoressa Soleti ogni giorno ascoltiamo di statistiche curve e vari indici spesso di difficile comprensione. In cosa consistono concretamente i metodi utilizzati per l’analisi di un fenomeno di questo tipo?

La statistica si occupa dello studio dei fenomeni con lo scopo di analizzarne le caratteristiche, estrarne valori e informazioni significative e creare modelli su cui basare predizioni o decisioni. Fra le tante elaborazioni finalizzate alla sintesi delle informazioni contenute nei dati, quelle di più immediata applicazione sono i valori medi, i rapporti statistici, gli indici di variabilità e la determinazione di una funzione che le esprima. I rapporti statistici assumono notevole interesse perché consentono di ottenere informazioni logiche facilmente confrontabili, in quanto annullano l’ordine di grandezza dei fenomeni analizzati. Per fare un esempio, è evidente che 100 decessi per Covid-19 non hanno lo stesso significato in una regione da 10 milioni di abitanti (come la Lombardia) ed in una di trecentomila abitanti (come il Molise). Fondamentale, inoltre, è la corretta interpretazione del dato. A titolo esemplificativo, a volte gli indici di letalità e mortalità sono utilizzati come sinonimi. La letalità, invece, è il rapporto tra morti per una malattia e il numero totale di soggetti affetti dalla stessa malattia, mentre la mortalità è il rapporto tra il numero di morti e il totale della popolazione (e non il numero di malati). Per il Covid-19 siamo di fronte a un fenomeno a discreta letalità e bassissima mortalità.

Più complessi sono gli studi dei modelli previsionali sullo sviluppo del contagio. Generalmente le epidemie partono lentamente (nascono i focolai), poi incrementano velocemente (la fase esponenziale), poi vi è una fase di crescita lineare fino ad un ritorno a livelli pre-endemici. I modelli predittivi tendono a modellizzare queste diverse fasi dinamiche, ma sono tutti parziali e per questo da valutare con molta cautela.

Prima si parlava del raggiungimento di un picco, successivamente di plateau. Che differenza c’è nell’analisi di questi 2 fenomeni e soprattutto come mai ci si attendeva un picco, ma si è poi trasformato in qualcos’altro?

Paragonando l’andamento dei contagiati ad una montagna ripida, il picco rappresenta la cima della montagna in cui si ha il numero massimo di contagiati. In Italia si è parlato per settimane di “picco”, esaminando tutti i giorni i dati della Protezione Civile e chiedendosi quando sarebbe arrivato. Da qualche giorno il presidente dell’Istituto Superiore di Sanità Silvio Brusaferro ha, invece, parlato di un “plateau”. Qual è la differenza tra i due termini? Ricorrendo nuovamente ad un confronto metaforico, si può dire che il picco è la cima di una montagna, il plateau è un altopiano. La motivazione del perché il picco si è trasformato in qualcos’altro è semplice. Il “picco” si raggiunge se un’epidemia è lasciata correre senza restrizioni, ad esempio nel caso di una semplice influenza. Il virus non incontrando ostacoli (ad eccezione dei vaccinati e dei guariti) corre rapido, arriva in cima e infine, non trovando più corpi da infettare, crolla rapidamente tornando a valle. Ma l’epidemia di Covid-19 non è stata lasciata libera, ma ingabbiata dalle misure di contenimento via via più restrittive e, pertanto, il “picco si è trasformato in plateau. Ci vorranno giorni per superare il plauteau e tentare la discesa dal momento che il virus non è sconfitto, come nel caso dell’influenza, ma solo in gabbia, e continua a contagiare tutti i contagiabili. Il picco ha un costo enorme in termini di contagiati e di decessi. Secondo uno studio dell’Imperial College di Londra, le misure restrittive messe in campo in Italia hanno evitato migliaia di decessi. Senza contare i milioni di contagiati che si sarebbero registrati. Secondo diverse valutazioni statistiche un picco incontrollato sarebbe stato raggiunto probabilmente già entro i primi giorni di marzo, e oggi probabilmente staremmo osservando un crollo verticale dei nuovi casi ma le conseguenze sarebbero state drammatiche.

Possiamo affermare che i dati diramati fotografino una situazione reale del nostro Paese? Ma soprattutto possiamo parlare veramente di dati statistici senza che questi siano la conseguenza di un campionamento stratificato della popolazione?

Per poter generalizzare i dati osservati all’intera popolazione, le osservazioni devono essere selezionate tramite un rigoroso sistema di campionamento (detto campione casuale) nel quale ogni unità ha la medesima probabilità di essere estratta (garantendo un oggettivo criterio di raccolta).Tale condizione non è soddisfatta durante l’esplosione di un’epidemia, in cui i dati vengono raccolti seguendo criteri di pura disponibilità con l’aggravante di politiche di somministrazione dei tamponi non uniformi tra regioni.

Oltre agli errori dovuti al criterio di raccolta dei dati, la bontà dei dati stessi è inficiata da altri tipi di distorsione. Ad esempio,i dati pubblicati giornalmente dalla Protezione civile riguardano prevalentemente i contagiati conclamati, ovvero i pazienti ai quali è stato somministrato il tampone. Il dato dei contagi risente inevitabilmente del numero di tamponi effettuati perché tendenzialmente al crescere del numero di tamponi aumenta il numero dei contagiati individuati. Il numero reale è,pertanto, sottostimato in quanto non è possibile finora identificare i paucisintomatici e gli asintomatici.

Con riferimento al numero dei decessi, il dato comunicato è relativo al numero di persone che al momento del decesso risultavano positive, non distinguendo per quanti di questi decessi il virus sia stato la causa di morte primaria.  In altre parole, il dato comunicato non effettua una distinzione tra decessi avvenuti “con” il virus e “per” il virus e questo potrebbe portare ad una sopravvalutazione del dato reale. Può verificarsi, al contrario, che una parte degli infetti non testati muoia senza dunque essere conteggiata nel novero dei decessi causati dal virus, sottostimando il numero dei decessi.

Facciamo un esempio più pratico. Nella nostra Regione Il 22 aprile abbiamo avuto un totale di nuovi contagi di 108 individui ed il giorno successivo di 109, il giorno 21 aprile erano 55. Pur avendo dati sostanzialmente raddoppiati ed in linea con i giorni di piena epidemia si parla di decrescita dei casi. Cosa vuol dire?

Per valutare l’andamento di una epidemia non bisogna tener conto soltanto degli ultimi dati a disposizione in quanto sono ancora in fase di consolidamento. Spesso ci sono ritardi tra i dati comunicati dalla Protezione civile e quelli rilevati dalle singole regioni, discrepanze che possono rendere fuorvianti gli aumenti (o cali) del numero dei contagiati da un giorno all’altro.

Un altro aspetto su cui si rischia di fare confusione, è la differenza tra l’aumento degli attualmente positivi al virus e l’aumento dei casi totali, entrambi forniti giornalmente dalla Protezione civile. Si tratta di due numeri che possono creare equivoci. La variabile “CASI TOTALI”è data dal totale dei soggetti attualmente positivi, dei guariti e dei decessi. L’incremento dei casi a cui fai riferimento è legato prevalentemente all’aumento del numero dei casi guariti e dei contagiati in isolamento domiciliare. Il numero di ricoverati con sintomi o in terapia intensiva è, invece, in diminuzione. Il numero dei decessi purtroppo è ancora stazionario.

Cosa ci possiamo aspettare in termini numerici nei prossimi giorni dall’analisi dei dati fin’ora in possesso?

È difficile prevedere, con livello accettabile di affidabilità, quando inizierà la riduzione significativa della  crescita dell’epidemia. Questo non per mancanza di modelli statistici adeguati, ma per la necessità di alimentare questi modelli con dati “buoni”. Abbiamo a che fare con un nuovo virus, non sappiamo quanti sono gli asintomatici, non c’è attualmente alcuna prova scientifica del fatto che chi si sia ammalato di COVID-19 sia immune al Coronavirus SARS-COV-2 e abbia gli anticorpi per resistere a una seconda infezione.

Grazie dottoressa per la disponibilità ad averci chiarito almeno alcuni dei dubbi che questa particolare situazione ha creato a molti dei nostri lettori.

Grazie a voi.

Non perdere il Tuo mensile in edicola
fb-share-icon

Lascia un commento

error

Enjoy this blog? Please spread the word :)