30Science.com

Dottor IA: modelli linguistici superano medici in test clinici

(4 Maggio 2026)

Roma – Un modello linguistico avanzato di intelligenza artificiale ha eguagliato o superato le prestazioni dei medici in compiti di ragionamento clinico, tra cui diagnosi, decisioni in pronto soccorso e pianificazione terapeutica. Il risultato emerge da uno studio guidato da Peter G. Brodeur (Beth Israel Deaconess Medical Center) con un ampio gruppo di ricercatori internazionali, pubblicato sulla rivista Science.
L’indagine rappresenta una delle analisi più estese finora condotte per confrontare direttamente sistemi di intelligenza artificiale e medici su una vasta gamma di attività cliniche. I ricercatori hanno valutato le capacità diagnostiche e decisionali di un modello della serie OpenAI o1, mettendolo a confronto con centinaia di medici e con precedenti sistemi di IA, sia su casi clinici standardizzati sia in un contesto reale, utilizzando dati di pazienti selezionati casualmente in un grande dipartimento di emergenza del Massachusetts.
I risultati mostrano che, in sei diversi esperimenti, il modello ha costantemente raggiunto o superato le prestazioni umane nel ragionamento diagnostico e nella gestione dei pazienti. Il vantaggio è apparso particolarmente evidente nelle fasi iniziali del triage in pronto soccorso, dove le decisioni devono essere prese rapidamente con informazioni limitate. In queste condizioni di incertezza, il sistema ha dimostrato una notevole capacità di utilizzare dati clinici frammentari e non strutturati.
Sia i medici sia il modello hanno migliorato le proprie prestazioni con l’aumentare delle informazioni disponibili, ma l’intelligenza artificiale ha evidenziato una maggiore efficacia nelle situazioni iniziali più complesse. Secondo gli autori, questi risultati indicano che i modelli linguistici stanno rapidamente raggiungendo, e in alcuni ambiti superando, il livello umano nel ragionamento clinico.
Gli studiosi precisano tuttavia che tali evidenze non implicano che i sistemi di IA siano pronti a operare in autonomia né che possano sostituire i medici nel processo diagnostico. Piuttosto, suggeriscono un potenziale ruolo complementare, in cui strumenti basati su IA, integrati con la valutazione clinica, potrebbero contribuire a ridurre errori diagnostici, ritardi e disuguaglianze nell’accesso alle cure.
Lo studio evidenzia anche limiti importanti: l’analisi si concentra sul ragionamento testuale, mentre la pratica clinica reale si basa anche su segnali visivi e uditivi, ambiti in cui l’intelligenza artificiale resta meno sviluppata. In una prospettiva collegata, Ashley M. Hopkins ed Erik Cornelisse sottolineano che “l’accuratezza su un compito definito è solo una dimensione della prontezza all’implementazione”, evidenziando la necessità di garantire efficacia, equità, sicurezza, trasparenza e monitoraggio continuo prima di un utilizzo diffuso. (30Science.com)

30Science.com
Agenzia di stampa quotidiana specializzata su temi di scienza, ambiente, natura, salute, società, mobilità e tecnologia. Ogni giorno produciamo una rassegna stampa delle principali riviste scientifiche internazionali e quattro notiziari tematici: Scienza, Clima & Natura, Salute, Nuova Mobilità e Ricerca Italiana contatti: redazione@30science.com + 39 3492419582