I studien lät forskarna två versioner av Chat GPT dra slutsatser utifrån läkarnas anteckningar om 30 patienter. Det handlar om symtom och resultat från fysiska undersökningar som matats in i systemen. Dessutom fanns information om labbvärden som resultat av blod- och urinprov.
För varje patient gjorde Chat GPT:n förslag på olika diagnoser som jämfördes med de förslag som getts av läkare samt den korrekta diagnosen som ställdes senare. Forskarna jämförde i hur många av fallen det rätta svaret fanns bland de fem toppförslag som lämnats av läkare eller Chat GPT.
Enligt resultaten, som publicerats tidskriften Annals of Emergency Medicine, hade läkarna den rätta diagnosen bland sina fem toppförslag i 87 procent fallen. Det var samma andel som version 3.5 av Chat GPT. Den senare versionen 4.0 hade däremot den rätta diagnosen med i 97 procent av fallen.
Forskarna påpekar att Chat GPT inte är ett medicintekniskt hjälpmedel och att det finns många orosmoment kring integritet när uppgifter delas med den.
”Men det finns potential för att vi kan använda det i framtiden för att spara tid och minska väntetider på akuten. Artificiell intelligens skulle också kunna vara ett hjälpmedel för mindre erfarna läkare eller för att hitta sällsynta sjukdomar”, säger Hidde ten Berg vid Jeroen Bosch Hospital i Nederländerna och en av forskarna bakom studien i en presskommentar.