Riferimento bibliografico

Tao Tu, et al. Towards Generalist Biomedical AI. NEJM AI 2024;1(3) DOI: 10.1056/AIoa2300138.

 

In sintesi

L’Intelligenza Artificiale (AI) con le sue applicazioni ha la potenzialità di trasformare la ricerca biomedica, ma anche di impattare in maniera significativa sulla pratica clinica e quindi anche di entrare a fare parte del lavoro quotidiano in un ospedale. Tuttavia, la maggioranza dei sistemi di intelligenza artificiali sviluppati sono altamente specialistici, funzionando all’interno di un singolo ambito di dati ristretto, come ad esempio il riconoscimento delle immagini, l’elaborazione del testo, le analisi genomiche. Questo articolo presenta lo studio di un approccio di AI multimodale (intelligenza artificiale multimodale), ovvero capace di codificare ed integrare assieme diversi tipi di informazioni biomediche, dando la possibilità di eseguire effettivamente dei task applicativi realistici per un ambiente ospedaliero.

 

Il contesto e il punto di partenza

Gli autori partono dalla considerazione che la medicina è una disciplina multimodale. Nella pratica clinica di un ospedale, lo staff medico tipicamente prende decisioni integrando moltissime sorgenti di informazioni: esami di laboratorio, test genetici, immagini derivanti da radiografie o TAC, osservazioni dirette sui pazienti e così via. Tuttavia, la maggior parte dei modelli di Intelligenza Artificiale sviluppati ad oggi sono stati addestrati in modo specifico per un singolo task, intendendo con questo che un applicativo di AI normalmente è capace di elaborare solo un certo tipo di dato, ma non di integrare diversi tipi di informazione.

 

Le caratteristiche dello studio

Lo studio di Tao Tu e colleghi, tutti provenienti dai laboratori di “Deep Learning” di Google e DeepMind, presenta un’applicazione innovativa di AI capace di operare su un gran numero di dati di tipo diverso, integrandoli in un unico modello matematico. I tipi di dati che il sistema proposto è in grado di utilizzare variano da report di tipo clinico, singole osservazioni mediche, dati genomici fino ad arrivare a immagini radiologiche, dermatologiche e reports di anatomia patologica. Lo studio è teorico, ma gli autori alla fine del loro articolo, per valutare in un caso reale le capacità e i limiti del sistema sviluppato, conducono una valutazione pratica su un set di referti radiografici del torace generati dal modello, mettendoli a confronto con quelli redatti da esperti umani.

 

I risultati ottenuti

Dallo studio, attraverso una complessa serie di test, emerge come il sistema sviluppato dagli autori (chiamato Med-PaLM Multimodal) sia in grado di raggiungere delle performance quasi-umane, paragonabili in alcuni casi a risposte cliniche di esperti medici, il che suggerisce una potenziale utilità clinica. La performance del sistema Med-PaLM Multimodal risulta particolarmente buona nel caso del riconoscimento e trattamento di immagini di radiografie. Va comunque notato come la capacità dello strumento di fornire risposte cliniche, anche se simile a quella degli esperti medici, non risulti comunque soddisfacente in alcuni ambiti analizzati ad esempio nella creazione di report clinici a partire dalle immagini radiologiche.

 

Limiti dello studio

Gli autori stessi, pur evidenziando i vantaggi di Med-PaLM Multimodal, ne illustrano anche una serie di limiti . Il sistema di AI presentato, ad esempio, pur essendo stato sviluppato in modo da poter elaborare diverse fonti di informazioni, non è ancora capace di elaborare dati di tipo audio oppure visivi ma tridimensionali (3D), e manca quindi ancora di effettiva generalità. Gli autori stessi inoltre ricordano che tutti i sistemi di AI, per essere veramente utilizzabili in setting di tipo clinico reale, necessitano di essere addestrati su database di grandissime dimensioni contenenti casi provenienti da popolazioni eterogenee, al fine di verificare l’equità del modello e non praticare nelle loro previsioni disuguaglianze di alcun tipo.

 

Quali le novità

La novità risiede nello sviluppo di Med-PaLM Multimodal (Med-PaLM M), un sistema di intelligenza artificiale biomedica generalista in grado di elaborare e interpretare in modo flessibile diversi tipi di dati biomedici (ad es. linguaggio clinico, immagini, genomica), a differenza dei modelli di AI tradizionali, solitamente specializzati per una singola modalità di dato o compito.

 

Quali le prospettive

Lo studio del team di Tao Tu e colleghi è un esempio di come sistemi di AI possano essere integrati all’interno del flusso di informazioni multimodale che è possibile trovare in un ambiente clinico reale. Questo offre delle prospettive potenzialmente molto interessanti sia dal punto di vista degli sviluppatori dei sistemi di AI, fornendo un esempio di come costruire esempi di AI capaci di trattare dati eterogenei, sia dal punto di vista dei ricercatori biomedici e clinici, che potrebbero trovare in futuro un nuovo tipo di ausilio alle proprie decisioni.

 

A cura di Davide Corà e Lorenza Scotti


Iscriviti alla Newsletter

* Richiesti
Scegli la newsletter
Consenso all’utilizzo dei dati

Aging Project userà le informazioni che fornisci al solo scopo di inviarti la newsletter richiesta.

Puoi annullare l'iscrizione in qualsiasi momento cliccando sul link che trovi nel footer dell'email. Per informazioni sulla Privacy Policy clicca qui.

Cliccando su "Acconsenti", accetti anche che le tue informazioni saiano trasferite a Mailchimp per l'elaborazione. Ulteriori informazioni sulle privacy di Mailchimp qui