Analiza je pokazala da se chatbotovi bolje snalaze kod zatvorenih pitanja i jasno definiranih zadataka.

Koristite AI za zdravstvene savjete? Nova studija otkriva da je svaki peti odgovor visoko rizičan
Foto: Freepik Premium | Ilustracija

AI chatbotovi poput ChatGPT-a i Gemini-ja sve češće se koriste za traženje zdravstvenih informacija, ali novo istraživanje pokazuje da to može biti ozbiljan problem.

Studija objavljena u medicinskom časopisu BMJ Open otkriva da gotovo polovina odgovora koje ovi sistemi daju može biti netačna ili obmanjujuća. Istraživači iz SAD-a, Kanade i Velike Britanije analizirali su pet popularnih AI sistema poput ChatGPT-a, Gemini, Meta AI, Grok-a i DeepSeek.

Svakom od njih postavljeno je po deset pitanja iz pet oblasti medicine kako bi se procijenio kvalitet odgovora.

Rezultati nisu ohrabrujući: Oko 50 posto odgovora označeno je kao problematično, dok je čak 20 posto ocijenjenih odgovora svrstano je u kategoriju visoko problematičnih.

To praktično znači da svaki peti odgovor može korisnika dovesti u ozbiljnu zabludu.

Gdje AI griješi, a gdje je precizan?

Analiza je pokazala da se chatbotovi bolje snalaze kod zatvorenih pitanja i jasno definiranih zadataka. Posebno su precizni u temama kao što su vakcine i rak, gdje postoje jasni i strukturirani podaci.

Međutim, problemi nastaju kod otvorenih pitanja i kompleksnijih tema. U oblastima poput matičnih ćelija i prehrane, tačnost odgovora značajno opada, a informacije postaju nejasnije ili nepotpune.

Dodatni problem je način na koji chatbotovi komuniciraju. Istraživači upozoravaju da odgovori često dolaze s visokim nivoom samopouzdanja, čak i kada nisu u potpunosti tačni. Također, nijedan od analiziranih sistema nije dosljedno pružao kompletne i pouzdane reference za svoje tvrdnje, prenosi Brussels Times.

Ovakvi nalazi dodatno naglašavaju potrebu za oprezom pri korištenju AI alata u medicinske svrhe, posebno kada su u pitanju ozbiljne zdravstvene odluke.