L’applicazione dell’intelligenza artificiale (AI) in medicina ha generato, negli ultimi anni, un volume crescente di ricerca: gli articoli su AI e machine learning in sanità indicizzati su PubMed sono passati da 3.351 nel 2019 a 23.306 nel 2023, secondo una revisione bibliometrica pubblicata come preprint su medRxiv (Awasthi et al., 2024).
Secondo Van de Sande et al. (npj Digital Medicine, 2024), nonostante il grande volume di pubblicazioni sull’AI in medicina, meno del 2% dei modelli sviluppati in ricerca supera la fase di prototipazione e raggiunge un’applicazione clinica stabile. Il problema non è tecnico, almeno non solo: riguarda la qualità dei dati su cui i modelli vengono addestrati e la loro compatibilità con gli standard regolatori. È quello che Tacchetti e colleghi hanno analizzato sistematicamente prima di progettare S-RACE.
Il professor Carlo Tacchetti e il Prof. Antonio Esposito, coordinatori del centro S-RACE, nato in seno a UniSR e IRCCS Ospedale San Raffaele con il supporto di Microsoft, hanno risposto a questo problema con S-RACE platform, una piattaforma AI sviluppata per costruire modelli di prognosi e terapia in medicina.
Perché l’intelligenza artificiale in medicina fatica ad arrivare in clinica
Prima di sviluppare S-RACE, gli scienziati hanno analizzato sistematicamente la letteratura scientifica per capire perché i modelli di AI esistenti non funzionino nella pratica. L'analisi ha identificato due cause principali. «La prima riguarda la qualità e i bias, cioè i “pregiudizi”, dei dati su cui la maggior parte dei modelli sono addestrati. Un modello allenato su dati raccolti in modo non uniforme o discontinuo o con criteri diversi da istituto a istituto produce previsioni inaffidabili appena si cambia contesto», spiega Tacchetti.
La seconda è la compliance regolatoria, cioè il rispetto delle normative europee: un modello che non rispetta gli standard - come il Regolamento europeo sull'AI, il GDPR, l'ISO 42001 o il Risk Management Framework del National Institute of Standards and Technology statunitense - non può essere usato in clinica, indipendentemente da quanto funzioni sul piano tecnico. Su queste premesse è stata progettata l'architettura di S-RACE platform.
Primo livello di S-RACE platform: estrarre dati accurati e standardizzati
La piattaforma S-RACE è ospitata su cloud e articolata in più livelli sovrapposti. Il primo livello riguarda l’acquisizione dei dati: nel pieno rispetto delle norme sulla privacy, la piattaforma accede alle banche dati ospedaliere e importa i dati dei pazienti selezionati per uno studio disegnato per rispondere ad una specifica domanda scientifica di partenza. Dei pazienti selezionati, S-RACE importa cartelle cliniche, referti radiologici e altri documenti, estrae i dati rilevanti e li classifica secondo la nomenclatura medica internazionale UMLS (Unified Medical Language System), un vocabolario di riferimento per la comunicazione standardizzata dei dati sanitari.
I dati estratti sono poi codificati secondo il protocollo FHIR (Fast Healthcare Interoperability Resources), uno standard internazionale per la rappresentazione e lo scambio di informazioni sanitarie, e sottoposti a pseudoanonimizzazione prima di passare al livello di analisi. La pseudoanonimizzazione è una procedura che sostituisce i dati personali come nome, cognome e altro di un soggetto con alias o identificativi indiretti, in modo tale che non siano riconducibili al proprietario.
Secondo livello di S-RACE: controllo qualità, addestramento e validazione
Il secondo livello consiste nell’analisi dei dati estratti e pseudoanonimizzati. Questa è articolata in quattro fasi sequenziali. Le prime due servono a stabilire se i dati raccolti sono utili e adeguati a rispondere alla domanda di ricerca iniziale. Esse includono la fase di data quality, cioè la valutazione della qualità dei dati estratti, e quella di exploratory data analysis, che individua ed evidenzia quei pazienti per cui mancano alcuni dati.
Questo archivio curato e standardizzato di dati clinici reali rappresenta la base su cui allenare qualsiasi modello di Intelligenza Artificiale in medicina utile per rispondere a una domanda di ricerca. Ogni modello così costruito viene rilasciato solo dopo una validazione esterna su coorti di pazienti provenienti da ospedali che non hanno partecipato allo studio. Quest’ultima è una condizione necessaria per verificare che il modello proposto dalla piattaforma non sia “cucito” sui dati del solo San Raffaele.
Un esempio concreto: il modello predittivo del tumore del rene
Uno dei casi studio completati grazie all’uso di S-RACE riguarda il tumore del rene, sviluppato in collaborazione con il Prof. Andrea Salonia e il Dott. Alessandro Larcher dell’Urological Research Institute (URI), l’istituto urologico del San Raffaele. La domanda clinica di partenza era: è possibile prevedere, prima dell'intervento chirurgico, quali pazienti con carcinoma renale svilupperanno una recidiva?
Questa domanda nasce da un’esigenza clinica. La chemioterapia adiuvante, cioè successiva all’intervento chirurgico, viene somministrata solo a circa il 30% dei pazienti che sviluppano una recidiva del tumore del rene. Come spiega Tacchetti: «Sapere prima della chirurgia come evolverà il tumore, se darà recidiva e con quale probabilità, aiuterebbe il clinico a capire se i pazienti beneficerebbero della chemioterapia neoadiuvante, che si somministra prima dell’operazione, così da ridurre la massa tumorale e scongiurare il rischio di recidiva».

Tuttavia, a causa dell’invasività della procedura, nel tumore del rene spesso non è possibile eseguire una biopsia prima dell’intervento. Senza questo dato istopatologico gli studi che hanno tentato di valutare l'efficacia della chemioterapia neoadiuvante non hanno fornito indicazioni conclusive.
Tacchetti e colleghi hanno quindi usato S-RACE per estrarre dai dati di circa 3.000 pazienti con carcinoma renale un insieme di parametri significativi rispetto al rischio di recidiva. «In questo caso, a partire dai dati reali, S-RACE ha estratto quelli più indicativi per costruire un modello di prognosi del tumore», spiega Tacchetti. Lo studio ha anche confrontato il percorso automatizzato della piattaforma con la selezione manuale delle variabili da parte dei clinici.
Mentre i medici avevano selezionato manualmente 69 variabili predittive di rischio di recidiva, la piattaforma ne aveva identificate 206. Degli otto parametri risultati rilevanti nel modello finale, sei erano gli stessi in entrambi i percorsi, quello seguito dall’AI e quello manuale. Ma due, i livelli di emoglobina e di piastrine, non erano stati messi in evidenza dall'analisi manuale, mentre erano emersi dall’analisi con S-RACE. Parametri che nessuno aveva mai considerato rilevanti per la prognosi del tumore al rene, eppure fondamentali.
Comprensibilità e fiducia: l'algoritmo non decide, il medico sì
Uno dei temi più critici nell'applicazione dell’Intelligenza Artificiale in medicina è quello della comprensibilità dei modelli, ovvero la capacità di rendere chiaro al medico il ragionamento che ha portato l'algoritmo a una certa previsione. È anche uno dei motivi principali per cui i modelli cosiddetti black box, di cui non è noto il ragionamento, pur essendo spesso i più performanti, raramente superano il vaglio clinico. «La responsabilità della decisione diagnostica, prognostica e terapeutica rimane del medico», sottolinea Tacchetti. «Se utilizzo un algoritmo per supportare la mia decisione, ma non so quale ragionamento ha seguito, non posso prendere una decisione ponderata.»
S-RACE adotta dunque un approccio white box, cioè trasparente, e integra tecniche come SHAP (SHapley Additive exPlanations), che quantificano il contributo di ciascun parametro alla previsione fornita dal modello. In altre parole, la piattaforma indica “quanto pesa” ogni parametro nella previsione fatta. Nell’esempio del tumore del rene, nella dashboard che riassume i parametri identificati dalla piattaforma, accanto al livello di rischio di recidiva calcolato per il paziente sono visibili i contributi relativi di ogni variabile alla definizione di questo rischio e le indicazioni per interpretarli. A questo si aggiunge l'error analysis: un sistema che identifica, tra i pazienti in esame, quelli per cui il modello potrebbe sbagliare, fornire cioè una previsione sbagliata.
Federazione e real world data: la sfida del dato reale
Tra le innovazioni più significative di S-RACE troviamo la sua architettura federata. Grazie a questa caratteristica, ogni ospedale che partecipa a uno studio multicentrico non trasferisce i propri dati a un server centrale: è la piattaforma a esportare le risorse computazionali verso i singoli centri. Ogni centro allena il proprio modello localmente; i modelli vengono poi centralizzati e combinati in un modello unico, che viene ridistribuito ai centri in un ciclo iterativo. «In questo modo, i centri partecipanti non devono condividere i propri dati, mantenendone così la riservatezza», spiega Tacchetti.
Altrettanto centrale è il tema dei real world data, i dati raccolti nella pratica clinica ordinaria, su popolazioni non selezionate. A differenza dei classici studi randomizzati controllati, che per esempio validano un farmaco su coorti di pazienti molto omogenee e selezionate, i real world data riflettono la complessità reale: comorbidità, terapie concomitanti, variabilità nei tempi di raccolta degli esami, differenze nei follow-up. Lavorare su questi dati consente di sviluppare modelli predittivi più aderenti alla popolazione che il medico incontrerà davvero.
Verso la clinica: il prossimo passo è il più difficile
A maggio 2026, S-RACE ospitava 22 progetti di ricerca attivi, focalizzati su aree come il diabete, l’oncologia, le patologie cardiovascolari, la neurologia, il neurocritical care, ed era popolata con i dati di circa 65000 pazienti. Il salto verso l’uso clinico vero e proprio, quello in cui il modello informa in tempo reale la decisione del medico sul singolo paziente, è ancora da compiere. E Tacchetti sottolinea che il campo si muove a velocità tale da rendere ogni previsione a lungo termine quasi impraticabile.
«L'evoluzione dell’AI è talmente veloce che se mi aveste chiesto come vedo la piattaforma da qui alla fine dell'anno, non avrei avuto abbastanza tempo per rispondere», racconta. Quello che non cambia è il messaggio che il professore ha per le prossime generazioni di medici: «Questi sistemi saranno sempre più pervasivi in sanità. Bisogna studiare già da ora e tenersi aggiornati continuamente sull’evoluzione della tecnologia, per usarla consapevolmente», conclude.
Bibliografia
Artificial Intelligence in Healthcare: 2023 Year in Review, Awasthi et al., 2024, medRxiv
To warrant clinical adoption AI models require a multi-faceted implementation evaluation, van de Sande et al., 2024, npj digital medicine
Regolamento (UE) 2024/1689 del Parlamento europeo e del Consiglio, del 13 giugno 2024