Chat GPT-4 на рівні лікарів-експертів може впоратись в оцінці зору – дослідження

Згідно з дослідженням Кембриджського університету, OpenAI GPT-4 демонструє майже такі ж результати, як і експерти в офтальмології.

У дослідженні, опублікованому в журналі PLOS Digital Health, порівнювалися LLM, GPT-3.5, PaLM 2 та LLaMa за допомогою тесту з 87 запитань. Експерти-офтальмологи, стажери та молодші лікарі отримували однаковий іспит. GPT-4 правильно відповів на 60 запитань, що краще, ніж молодші лікарі (37) і трохи краще за трьох стажерів (59,7).

“GPT-4 показав кращі результати, ніж стажери та молодші лікарі, правильно відповівши на 60 з 87 запитань”, - зазначили дослідники.

Хоча ці результати є обнадійливими, дослідники вказують на обмеженість запитань та нахильність магістрантів до "галюцинацій" або вигадок. Крім того, системам також бракує нюансів, що може призвести до неточностей.

Нагадаємо, що раніше дослідники OpenAI попередили про потужне відкриття у сфері штучного інтелекту, яке може бути загрозою для людства.