Per una migliore esperienza, mantieni il tuo browser aggiornato. Controlla qui le ultime versioni.
INSPIRING STORY

Coronavirus: come può aiutarci la Data Science?

Ne abbiamo parlato con Giovanni Bocchi (Managing Partner - Head of Data Science & A.I. Researcher) e Francesco Cuccio (Managing Partner & Data Architect) di Kiwi Data Science, una delle imprese che ha sede in OpenZone. La società ha sviluppato una dashboard di monitoraggio dei numeri mondiali della situazione coronavirus, aggiornati in tempo reale. La Data Science ci può aiutare in questo periodo così particolare?
La dashboard

Mai come in questi giorni l’opinione pubblica ha rivolto la propria attenzione verso numeri, statistiche, diagnosi, terapie e prognosi. Se da un certo un punto di vista questo denota quanto seriamente venga percepita dalla comunità la situazione che stiamo vivendo, da un altro è necessario constatare come spesso l’enorme mole di dati che ci sommerge ogni giorno non necessariamente si trasforma in informazioni realmente utili.
 
"Il progetto è nato quando abbiamo capito che la situazione italiana non sarebbe rimasta limitata ai primi due focolai individuati, ma che i numeri avrebbero potuto crescere molto" ci racconta Giovanni Bocchi. "All’inizio ci siamo concentrati sulla letteratura scientifica. Era importante sapere quali studi potessero esserci di aiuto per analizzare i dati mondiali. Successivamente, dopo aver individuato le fonti ufficiali dalle quali prendere i dati, abbiamo progettalo l’analisi in termini di calcoli, modelli e visualizzazione. Esattamente come in tutti i lavori che facciamo, abbiamo scelto la miglior tecnologia da utilizzare e in un paio di giorni abbiamo sviluppato il tutto."
Ad oggi, le analisi vengono  aggiornate automaticamente in real-time permettendoci di continuare a leggere articoli scientifici, studiare e apportando migliorie a quanto fatto. Per farlo, ci atteniamo a fonti ufficiali e affidabili. Il nostro lavoro si basa su due fonti distinte:
il repository gestito dalla John Hopkins University Center for Systems Science and Engineering e quello della Protezione Civile italiana
 
Se prendiamo in considerazione - per esempio - il numero di contagiati, solo confrontandolo con i valori dei giorni precedenti ed eventualmente anche con altri dati (il numero di decessi, di guarigioni, etc.) esso fornisce un’informazione rilevante al fine di ottenere indicazioni sull’evoluzione dell’epidemia. L’accesso pubblico a dati ufficiali e contestualizzati è indispensabile ma non sufficiente: occorre agevolare l’interpretazione con visualizzazioni chiare, semplici e supportate da commenti che aiutino anche i non esperti nella comprensione dei numeri.
 

"La speranza è che il nostro contributo, cosi come quello di molti altri Data Scientist, possa essere di supporto ai report ufficiali nazionali e internazionali, possa agevolare la lettura dei freddi numeri e fornire un metodo per interpretarli in modo corretto."
 
L’apporto che in questo momento la Data Science può offrire è di estrema importanza.

Big Data

Nell’ultimo mese sono stati pubblicati numerosi articoli scientifici riguardanti il virus SARS-CoV-2 da parte dei principali centri di ricerca mondiali. Inoltre, i cosiddetti Big Data potrebbero giocare un ruolo fondamentale nel monitoraggio e nel contenimento dell’epidemia come sta succedendo in Corea del Sud dove si tracciano i movimenti degli individui con un'app. Così facendo si possono ricostruire movimenti, interazioni, individuare cluster e, tramite l’intelligenza artificiale, individuare le zone di contagio più probabili ed ottimizzare i controlli delle forze dell’ordine. Questa tematica apre sicuramente un dibattito etico-morale in termini di privacy. Pertanto un’attenta valutazione spetta a chi scientificamente, politicamente e giuridicamente sta gestendo l’emergenza.


I dati possono davvero aiutarci a fare previsioni? Si parla tanto di "picco", ma cosa è lecito aspettarci?
 

Data scientist, sociologi, epidemiologi e medici

Su questo punto può essere utile un po’ di chiarezza. Prima di tutto dobbiamo distinguere fra diversi approcci di analisi. I modelli costruiti con funzioni esponenziali e logistiche hanno l’obiettivo di descrivere e monitorare quanto successo in passato e individuare cambiamenti non previsti. Questi non hanno valenza predittiva a lungo termine. Al contrario, esistono approcci più complessi con i quali ci si prefigge di studiare l’intera dinamica del sistema e stimare i diversi picchi epidemiologici, la durata temporale, il periodo di incubazione, e molte altre informazioni.

Purtroppo non si tratta solo ed esclusivamente di un problema matematico/computazionale in quanto la definizione del problema e quindi la scrittura delle equazioni del sistema necessitano anche della formulazione di ipotesi e della scelta di diversi parametri iniziali che – senza dubbio - i puri analisti non possono conoscere. Ed è qui che a mio parere la collaborazione tra data scientist, sociologi, epidemiologi e medici deve essere favorita ed incentivata. Solo l’unione di diversi domini di competenze può dare un contributo rilevante.
OpenZone è il campus dedicato alla Salute. Il più delle volte, quando ci pensiamo, ci viene in mente la ricerca clinica. Ma in realtà prendersi cura passa anche dalla data science, in che modo?
A rispondere è il Managing Partner e Data Architect, Francesco Cuccio. "Il tema è sicuramente molto ampio in quanto oltre alla Data Science vera e propria vanno presi in considerazione altri fattori che – insieme – contribuiscono alla possibilità di beneficiare di nuove modalità di gestione della salute in senso lato. Molti di questi sono tecnologici o anche infrastrutturali: si pensi ad esempio al mercato dei wearables, che a sua volta dipende dalla presenza di connettività costante per assicurare una raccolta tempestiva del dato o alle tecnologie che permettono analisi e rilevazione di anomalie complesse in tempo reale (Complex Event Processing)"

Un contributo preventivo

Il primo importante contributo, quindi, è preventivo ed entra in azione ancor prima che si parli di “paziente”, attraverso un regolare monitoraggio di diversi parametri legati allo stile di vita che può portare ad intraprendere azioni correttive ben prima che si manifestino problemi concreti. Si pensi al monitoraggio del battito cardiaco durante l’attività fisica e la possibile individuazione di eventuali irregolarità o aritmie, o all’analisi del sonno e dei cicli sonno-veglia, al tracking del peso, della glicemia e via dicendo.


Un report di McKinsey mostra come – già nel 2012 - negli Stati Uniti i costi legati all’health-care rappresentassero quasi il 18% del PIL per un totale di 600 miliardi di USD. Contemporaneamente una survey del Ponemon Institute evidenziava che ben un terzo dei dati globali erano relativi al settore dell’health-care. Nel frattempo, il settore della Data Science è cresciuto del 350% dal 2012 e solo circa 35.000 candidati possiedono le competenze necessarie per ricoprire i ruoli richiesti.
 

Una rivoluzione nell'healthcare

Questi numeri mostrano come già da tempo sia in atto una vera e propria rivoluzione nel mondo dell’healthcare, resa possibile in prima istanza dalla disponibilità di dati (non solo recenti ma anche storici), ed in seconda istanza dalla possibilità di analisi ed applicazione di tecniche di Machine Learning e Intelligenza Artificiale.

Infine, va sottolineato che la trasformazione di questo settore deve fare i conti con alcuni ostacoli: da un lato l’industria medica ha intrinsecamente tempi che allungano lo sviluppo di soluzioni che si avvalgano di Big Data e Data Science, da un altro ci sono le inevitabili implicazioni riguardo la privacy e sicurezza del dato che necessitano di un delicato impianto normativo che ne tenga conto. Tuttavia, nonostante queste difficoltà, l’utilizzo di tali soluzioni sta diventando una realtà di fatto che speriamo cresca sempre di più e che possa aiutare le persone a prendersi cura della salute.