L'Intelligenza artificiale di Google in ospedale è più umana dei medici?

In un recente studio, i ricercatori di Google affermano di aver sviluppato un’intelligenza artificiale (AI) che supera in accuratezza ed empatia i medici reali, sollevando interrogativi sulla potenziale umanità dell’AI nel settore sanitario.

Sviluppo dell’AI di Google

L’azienda ha creato un modello di linguaggio avanzato chiamato AMIE (Articulate Medical Intelligence Explorer), alimentato da dati reali di cartelle cliniche e trascrizioni di appuntamenti medici. Questo sistema è stato utilizzato per condurre colloqui medici, come riportato in uno studio del 11 gennaio sul sito di preprint arXiv.

Metodologia dello studio

Nello studio, venti attori che simulavano di essere pazienti hanno partecipato a consultazioni mediche online basate su testo, senza sapere se stessero interagendo con un AI o con medici in carne ed ossa. Sorprendentemente, l’AI ha superato i medici reali in 24 delle 26 misure conversazionali prese in considerazione, mostrando maggiore empatia, cortesia e capacità di mettere a proprio agio i pazienti. Inoltre, l’AI ha eguagliato o superato i medici di base in tutte e sei le categorie diagnostiche esaminate.

Cosa si legge nello studio di AMIE

“Al centro della medicina c’è il dialogo medico-paziente, in cui un’abile anamnesi apre la strada a diagnosi accurate, gestione efficace e fiducia duratura.
I sistemi di intelligenza artificiale (AI) capaci di dialogo diagnostico potrebbero aumentare l’accessibilità, la coerenza e la qualità delle cure.
Tuttavia, avvicinare le competenze dei medici è una grande sfida eccezionale.
Qui presentiamo AMIE (Articulate Medical Intelligence Explorer), un sistema di intelligenza artificiale basato su Large Language Model (LLM) ottimizzato per il dialogo diagnostico.
AMIE utilizza un nuovo ambiente simulato basato sul gioco autonomo con meccanismi di feedback automatizzati per adattare l’apprendimento a diverse condizioni, specialità e contesti di malattie.
Abbiamo progettato un quadro per la valutazione degli assi di prestazione clinicamente significativi, tra cui l’anamnesi, l’accuratezza diagnostica, il ragionamento gestionale, le capacità di comunicazione e l’empatia.
Abbiamo confrontato le prestazioni dell’AMIE con quelle dei medici di base (PCP) in uno studio crossover randomizzato in doppio cieco di consultazioni basate su testo con attori pazienti validati nello stile di un esame clinico strutturato oggettivo (OSCE).
Lo studio ha incluso 149 scenari di casi provenienti da fornitori clinici in Canada, Regno Unito e India, 20 PCP per il confronto con AMIE e valutazioni da parte di medici specialisti e attori dei pazienti.
L’AMIE ha dimostrato una maggiore accuratezza diagnostica e prestazioni superiori su 28 assi su 32 secondo i medici specialisti e 24 assi su 26 secondo i pazienti.
La nostra ricerca presenta diversi limiti e deve essere interpretata con la dovuta cautela. I medici erano limitati a chat di testo sincrone non familiari che consentono interazioni LLM-paziente su larga scala ma non sono rappresentative della pratica clinica abituale.
Sebbene siano necessarie ulteriori ricerche prima che l’AMIE possa essere tradotto in contesti del mondo reale, i risultati rappresentano una pietra miliare verso l’IA diagnostica conversazionale.”

Precauzioni e limitazioni

I ricercatori hanno sottolineato che la tecnologia è ancora sperimentale e non è stata testata su pazienti reali. Inoltre, lo studio non è ancora stato sottoposto a revisione paritaria.

Dichiarazioni e interpretazioni

Alan Karthikesalingam, MD, PhD, scienziato della ricerca clinica presso Google Health e co-autore dello studio, ha dichiarato a Nature in un articolo del 12 gennaio:

“Vogliamo che i risultati siano interpretati con cautela e umiltà. Questo non significa in alcun modo che un modello di linguaggio sia migliore dei medici nel raccogliere la storia clinica”.

Egli ha osservato che i medici di base coinvolti nello studio probabilmente non erano abituati a interagire con i pazienti tramite una chat testuale, il che avrebbe potuto influire sulle loro prestazioni.

Ha inoltre notato che l’AI potrebbe sembrare più premurosa rispetto agli esseri umani perché, a differenza di questi ultimi, non si stanca.

Potenziale futuro dell’AI in sanità

Nonostante le avvertenze, i ricercatori sottolineano che lo strumento dimostra un “potenziale significativo” per trasformare la raccolta di storie cliniche e le conversazioni diagnostiche nel settore sanitario.

Iscriviti alla newsletter. Resta aggiornato!

Te la invieremo periodicamente per comunicazioni importanti e news sul mondo digitale. Potrai disiscriverti in ogni momento cliccando l'apposito link in calce alla newsletter.