Valentina Di Paola

NIH: IA potrebbe migliorare le procedure diagnostiche, ma per ora l’uomo è più preciso

(23 Luglio 2024)

Roma – I modelli di intelligenza artificiale sono in grado di rispondere alle domande dei quiz di medicina, progettate per valutare la capacità diagnostiche dei professionisti sanitari, anche se le abilità umane sono ancora superiori quando si tratta di descrivere i processi decisionali. A dimostrarlo uno studio, pubblicato sul Nature Partner Journal Digital Medicine, condotto dagli scienziati della National Library of Medicine (NLM) del National Institutes of Health e della Weill Cornell Medicine. Il team, guidato da Stephen Sherry, ha addestrato un sistema di intelligenza artificiale, che è stato in grado di superare un test con delle domande di medicina. I quiz, sottoposti al modello e a un gruppo di medici umani, facevano parte dell’Image Challenge del New England Journal of Medicine (NEJM). Il questionario fornisce immagini cliniche reali e una breve descrizione testuale che include dettagli sui sintomi e la presentazione del paziente, quindi chiede agli utenti di scegliere la diagnosi corretta tra le risposte a scelta multipla. Il programma di intelligenza artificiale ha risposto a 207 domande, fornendo una spiegazione del processo decisionale che lo portava a optare per l’opzione selezionata. Allo stesso tempo, nove partecipanti di diverse istituzioni, ognuno con una diversa specializzazione medica, hanno risposto alle domande assegnate, prima in un contesto che non prevedeva l’uso di risorse esterne (closed-book), e poi con la possibilità di ricercare informazioni online (open-book). Gli autori hanno quindi fornito ai medici la risposta corretta, insieme alla risposta del sistema di intelligenza artificiale e alla relativa motivazione. Infine, al personale sanitario è stato chiesto di valutare la capacità del modello di IA di descrivere l’immagine, riassumere le conoscenze mediche rilevanti e trascrivere il proprio ragionamento. Questo approccio ha mostrato che l’intelligenza artificiale e i medici avevano ottenuto punteggi simili nella selezione della diagnosi corretta. In realtà, riportano gli scienziati, l’IA otteneva punteggi più alti nei contesti closed-book, mentre nell’altro scenario primeggiavano i partecipanti umani, specialmente in caso di domande considerate più difficili. “L’implementazione dell’intelligenza artificiale nell’assistenza sanitaria – spiega Sherry – è potrebbe aiutare i professionisti medici ad effettuare diagnosi in modo più rapido e più preciso, velocizzando la selezione del trattamento più adeguato per alcuni pazienti. Nonostante ciò, il nostro lavoro suggerisce che l’intelligenza artificiale non è ancora abbastanza sofisticata da sostituire l’esperienza umana, fondamentale per una diagnosi completa”. In base alle valutazioni dei medici, inoltre, l’IA ha commesso più errori nel descrivere l’immagine visualizzata e nella spiegazione del ragionamento alla base del processo diagnostico, anche nei casi in cui la scelta finale risultava corretta. “Questi risultati – commenta Zhiyong Lu, autore corrispondente dello studio – rafforzano l’importanza di valutare ulteriormente intelligenza artificiale multimodale prima di introdurla in ambito clinico”. Nell’ambito del lavoro, gli studiosi hanno utilizzato il GPT-4V (Generative Pre-trained Transformer 4 with Vision), un modello di intelligenza artificiale multimodale, in grado di elaborare combinazioni di più tipi di dati, tra cui testo e immagini. “Il nostro lavoro – concludono gli scienziati – getta luce sul potenziale dell’intelligenza artificiale multimodale per aiutare i medici nel processo decisionale in ambito medico. Sono necessarie ulteriori ricerche per comprendere come tali modelli possano adattarsi alla capacità dei medici di eseguire diagnosi per i pazienti”.(30Science.com)

Valentina Di Paola
Classe ’94, cresciuta a pane e fantascienza, laureata in Scienze della comunicazione, amante dei libri, dei gatti, del buon cibo, dei giochi da tavola e della maggior parte di ciò che è anche solo vagamente associato all’immaginario nerd. Collaboro con 30science dal gennaio 2020 e nel settembre 2021 ho ottenuto un assegno di ricerca presso l’ufficio stampa dell’Istituto di ricerca sugli ecosistemi terrestri del Consiglio nazionale delle ricerche. Se dovessi descrivermi con un aggettivo userei la parola ‘tenace’, che risulta un po’ più elegante della testardaggine che mi caratterizza da prima che imparassi a usare la voce per dar senso ai miei pensieri. Amo scrivere e disegnare, non riesco a essere ordinata, ma mi piace pensare che la mia famiglia e il mio principe azzurro abbiano imparato ad accettarlo. La top 3 dei miei sogni nel cassetto: imparare almeno una lingua straniera (il Klingon), guardare le stelle più da vicino (dal Tardis), pilotare un velivolo (il Millennium Falcon).