Cercetătorii de la Mass General Brigham din Massachusetts au realizat un studiu care a testat modelele de inteligență artificială folosind 29 de viniete clinice bazate pe texte medicale de referință. Acest studiu a fost publicat în Jama Network Open și a avut ca scop evaluarea capacității chatboților de a furniza diagnostice medicale corecte. În cadrul studiului, chatboților le-au fost oferite pas cu pas informații medicale legate de o boală, inclusiv constatări ale consultațiilor și rezultate ale analizelor de laborator. Au fost astfel testate 21 de modele lingvistice, inclusiv cele dezvoltate de OpenAI, Anthropic, Google, xAI și DeepSeek. Rezultatele studiului arată că toate modelele dau diagnostice greșite în peste 80 de cazurile în care nu au acces la informațiile complete ale pacienților.
Studiul a descoperit că chatboții dau diagnostice greșite în peste 80% din cazurile medicale inițiale, chiar și atunci când li se oferă informații medicale incomplete. În cazurile în care li s-au oferit informații complete, chatboții au avut o rată a erorilor de peste 40%. Acest lucru sugerează că performanța chatboților de AI pe partea medicală depinde de volumul informațiilor, dar chiar și când li se oferă informații complete, aceștia pot induce utilizatorii în eroare. De asemenea, studiul a arătat că anumiți chatboți pot oferi diagnosticul corect pentru 90% dintre pacienți în anumite cazuri. Specialiștii consideră că aceste rezultate sunt îngrijorătoare, deoarece chatboții pot fi utilizați în mod eronat de către pacienți pentru a-și diagnostica și trata afecțiunile.
Contextul în care se desfășoară acest studiu este relevant, deoarece inteligența artificială devine tot mai populară în domeniul medical. Chatboții și asistenții virtuali sunt utilizați pentru a oferi consultații și sfaturi medicale, dar și pentru a ajuta la diagnosticarea și tratarea afecțiunilor. În acest context, este esențial să se evalueze capacitățile și limitările chatboților în domeniul medical, pentru a preveni erorile și a asigura siguranța pacienților. De asemenea, este necesar să se dezvolte modele de inteligență artificială mai avansate, care să poată furniza diagnostice și tratamente mai precise și mai sigure.
Impactul acestui studiu poate fi semnificativ, deoarece arată că chatboții nu sunt încă pregătiți să fie utilizați în mod autonom în domeniul medical. Acest lucru poate avea consecințe importante pentru pacienți, care pot fi induși în eroare de către chatboți și pot suferi consecințe grave în urma unor diagnostice și tratamente incorecte. De asemenea, acest studiu poate avea implicații pentru dezvoltatorii de chatboți și pentru instituțiile medicale, care trebuie să ia măsuri pentru a preveni erorile și a asigura siguranța pacienților. În acest sens, este necesar să se dezvolte reguli și standarde clare pentru utilizarea chatboților în domeniul medical.
Perspectivele viitoare pentru acest domeniu sunt complexe și necesită o abordare interdisciplinară. Pe de o parte, este necesar să se dezvolte modele de inteligență artificială mai avansate, care să poată furniza diagnostice și tratamente mai precise și mai sigure. Pe de altă parte, este necesar să se educe pacienții și personalul medical cu privire la capacitățile și limitările chatboților, pentru a preveni erorile și a asigura siguranța pacienților. În acest context, este esențial să se realizeze studii și cercetări continue pentru a evalua capacitățile și limitările chatboților în domeniul medical.
