Il software dello studio è fornito da Vara, una startup tedesca. L’AI dell’azienda è già utilizzata in oltre un quarto dei centri di screening del cancro al seno della Germania ed è stata introdotta all’inizio di quest’anno in un ospedale in Messico e in un altro in Grecia. Il team di Vara, con l’aiuto dei radiologi dell’Essen University Hospital in Germania e del Memorial Sloan Kettering Cancer Center di New York, ha testato due approcci.
Nel primo, l’AI lavora da sola per analizzare le mammografie. Nell’altro, l’AI distingue automaticamente tra le scansioni che ritiene normali e quelle che destano preoccupazione. Segnala queste ultime a un radiologo, che le esamina prima di vedere i risultati a cui è giunta l’AI.
Per addestrare la rete neurale, Vara ha fornito i dati AI di oltre 367.000 mammografie, inclusi gli appunti dei radiologi, le valutazioni originali e le informazioni sul fatto che il paziente alla fine avesse il cancro, per imparare come inserire queste scansioni in una delle tre categorie: “normale”, “neutra” (in cui non viene fornita alcuna previsione) e “probabile cancro”. Le conclusioni di entrambi gli approcci sono state quindi confrontate con le decisioni originariamente prese dai radiologi reali su 82.851 mammografie provenienti da centri di screening che non facevano parte delle scansioni utilizzate per addestrare l’AI.
Il secondo approccio, che vede medico e intelligenza artificiale lavorare insieme, è stato del 3,6% migliore nel rilevare il cancro al seno rispetto a un medico che lavorava in autonomia e ha sollevato meno falsi allarmi. Ci è riuscito mettendo da parte automaticamente le scansioni classificate come normali, che ammontavano al 63% di tutte le mammografie. Questa semplificazione potrebbe ridurre i carichi di lavoro dei radiologi.
I radiologi che utilizzano l’AI nel mondo reale sono tenuti dalla legge tedesca a guardare ogni mammografia, dando almeno un’occhiata a quelle che l’AI giudica normali. Thilo Töllner, un radiologo che dirige un centro tedesco di screening del cancro al seno, ha utilizzato il programma per due anni. A volte non è d’accordo quando l’AI classifica le scansioni come normali e compila manualmente i rapporti per indicare una conclusione diversa, ma la maggior parte delle volte concorda con l’AI.