Ne sentiamo parlare da mesi come un indice fondamentale per il monitoraggio dell’epidemia di coronavirus ma spesso l’interpretazione di tale valore può diventare oggetto di gaffe o può creare confusione tra la popolazione. Diverse settimane fa, ad esempio, circolavano ben due valori dell’indice di contagiosità Rt: 1.18 e 3.00. Nonostante la sostanziale differenza, i due valori non solo entrambi sono validi, ma la loro paternità è dovuta a due istituti molto accreditati: l’Istituto Superiore di Sanità (ISS) e il gruppo CovidStat dell’Istituto Nazionale di Fisica Nucleare (INFN).
In poche parole, l’indice Rt viene usato per indicare la potenzialità di trasmissione del virus. Il suo studio, quindi, è estremamente importante, sia per comprendere la capacità di diffusione, sia per fornire un metodo di monitoraggio dell’efficacia degli interventi e poter agire quindi di conseguenza. Un valore di Rt intorno a 2.00, ad esempio, indica che in media una persona contagiata trasmette il virus ad altre due persone. È doveroso ricordare, tuttavia, che l’indice Rt è frutto esclusivamente di calcoli matematico-statistici, non biologici. Una diminuzione o aumento dell’indice non deve far pensare ad una mutazione interna del virus. La sua dipendenza da molteplici fattori, tra cui come sopracitato gli interventi atti alla limitazione della sua trasmissibilità, lo rendono certamente un dato molto utile, ma allo stesso tempo dipendente dai criteri e dagli algoritmi utilizzati per il suo calcolo.
La diversità dei due dati, infatti, è dovuta ad una differenza nel modello utilizzato nel calcolo del suo valore. L’ISS, che forniva un più confortante 1.18 per l’indice Rt, considera esclusivamente le persone sintomatiche, escludendo di fatto tutti i dati derivanti da attività di screening, applicando, quindi, una sottostima del valore effettivo. L’INFN, invece, applica una sovrastima dell’indice, includendo nel proprio modello anche gli asintomatici e i guariti, ottenendo quindi il valore di 3.00. Entrambi i modelli sono differenti non solo nel tipo di dato che prendono in considerazione, ma anche nell’effettivo algoritmo di calcolo.
Il modello adottato dall’Iss per il calcolo dell’indice di contagiosità Rt, si basa sull’utilizzo di un più complesso metodo Monte Carlo, che sfrutta quindi un campionamento effettivo della distribuzione di probabilità. Il metodo in questione si chiama Markov Chain Monte Carlo (MCMC), ovvero metodo Monte Carlo su Catena di Markov.
I metodi Monte Carlo si basano su un numero sufficientemente alto di realizzazioni del fenomeno per comprendere in modo computazionale il comportamento della distribuzione; la catena di Markov, invece, definisce una serie di valori calcolati ogni passo, in cui definire la distribuzione. Dopo un certo numero di steps, possiamo sperare che il nostro algoritmo porti ad una convergenza alla distribuzione che stiamo cercando e da cui si può estrarre il comportamento e i criteri utili.
Ovviamente, affinché il processo funzioni, risulta necessario affidarsi ad una determinata funzione di verosimiglianza, che fornisca un metodo per poter aiutare l’algoritmo nella ricerca della corretta distribuzione. Il valore di questa funzione di verosimiglianza viene definita in base ai valori ottenuti nel comportamento del fenomeno in una finestra temporale antecedente. Questi valori dipendono, ad esempio, dal numero di casi di persone sintomatiche avvenute in quella finestra temporale. In pratica, il nostro algoritmo calcola una distribuzione a posteriori e ha quindi anche la necessità di avere un determinata quantità di dati precedenti, migliorando mano a mano che aumentano i dati a disposizione della pandemia e diminuendo la volatilità del valore estrapolato.
Il modello chiamato SIRD, adottato dal gruppo CovidStat dell’Istituto Nazionale di Fisica Nucleare, è un modello semplificato rispetto a quello adottato dall’ISS. Il modello SIRD utilizza e cerca di descrivere quattro parametri le cui iniziali compongono il nome del modello: numero di persone suscettibili al contagio (S), numero di persone infette (I), numero di persone di guarite (R), e decessi (D).
Come si può notare, i valori presi in considerazione non contengono solo i sintomatici, ma le persone infette in generale, sintomatiche e non. Una volta ottenuti questi dati il calcolo risulta abbastanza semplice. Inizialmente viene definito il rate dei quattro parametri beta per infezioni, alpha per guarigioni, gamma per decessi), ovvero la loro variazione in un arco temporale di 4 giorni, poi si definisce l’indice di contagiosità come: Rt = beta/(alpha + gamma).
Questo modello, oltre a risultare maggiormente semplificato, ha alcune limitazioni, ad esempio il numero di persone suscettibili è considerato infinito e non viene considerata la differenza di tempistiche nell’ottenimento dei dati per i quattro parametri.
A questo punto nasce spontaneo chiedersi quale sia, infine, il miglior modello per indicare l’indice di contagiosità Rt.
Da un punto di vista della robustezza dei modelli, entrambi possono vantare un ottimo comportamento: il modello sfruttato dall’Iss, infatti si basa su un metodo robusto e testato, così anche per il modello utilizzato dall’INFN che trova ottimi riscontri con confronti dei dati provenienti dalla Cina.
Nessuno dei due modelli è, però, perfetto. Entrambi hanno delle limitazioni e si presentano come stime del reale indice di contagiosità, che probabilmente è differente da entrambi i valori forniti. L’Istituto Superiore di Sanità di fatto applica come detto una sottostima del valore, eliminando quindi i dati degli asintomatici, poiché eccessivamente dipendenti da fattori altamente volatili, come ad esempio la quantità di tamponi effettuati. Questa scelta è atta a garantire una maggiore stabilità del valore, ma a discapito di una più completa stima del fenomeno. L’Istituto Nazionale di Fisica Nucleare, invece, utilizza un modello più completo, ma in questo caso introducendo una maggiore rumorosità dei dati forniti.
Non deve, quindi, risultare un problema convivere con questi due valori, ma è essenziale comprenderne le ragioni e i limiti dei loro modelli, in modo da poter analizzare lo stesso fenomeno da più punti di vista e averne una descrizione più accurata. L’obiettivo, in ogni caso, non cambia: portare il valore Rt a 0.
Articolo a cura di Federico Germinario.