ШІ-моделі використовують лише 11 слів у 88% своїх історій

Техно 13.06.2026 - 08:00 300 переглянули

13.06.2026 - 08:00 300 переглянули

Штучний інтелект створює тексти, спрощуючи висловлення думок. Фото: НВ — Техно

Виявлення обмежень мовних моделей штучного інтелекту

Як повідомляє НВ — Техно: 12 червня, 12:00. Дослідники виявили, що мовні моделі штучного інтелекту, такі як GPT-5.4 Mini, Claude Haiku 4.5 та Gemini 3.1 Flash-Lite, у 88% випадків використовують обмежений набір слів при створенні історій. Цей набір складається з 11 слів:

Lighthouse
Keeper
Baker
Mayor
Clockmaker
Fisherman
Librarian
Conductor
Mara
Elias
Elara

Найчастіше в історіях з'являється персонаж Еліас, який виконує роль доглядача маяка, і його присутність зафіксована приблизно у двох третинах усіх створених сюжетів.

Увагу на це явище звернув інженер-програміст Деніел Мей, який спільно з дослідниками Сілом Гамільтоном і Девідом Мімно проаналізував близько 20 тисяч історій, створених зазначеними мовними моделями. Незважаючи на частоту появи персонажа Еліаса, дослідники не знайшли доказів, що цей образ надзвичайно часто зустрічається в літературі або навчальних даних. Вони вважають, що причиною його популярності може бути використання набору даних WildChat, що містить мільйони діалогів між людьми та чатботом на базі GPT-3.5.

Факти про персонажа Еліаса Торна

Крім того, видання 404 Media повідомило, що ім'я Еліаса Торна було знайдено серед персонажів фентезійних книжок, а також як ім'я виконавця ембієнт-музики на платформі Amazon. Деніел Мей також виявив, що серед книг, де Еліас Торн вказаний як автор, є довідник про альтернативні методи лікування раку. Ці факти свідчать про те, що популярність персонажа, створеного штучним інтелектом, може бути пов'язана з конкретними даними, на яких базуються моделі.

Дослідження, проведене над мовними моделями штучного інтелекту, підкреслює важливість аналізу даних, на яких ці моделі навчаються. Обмеження у виборі слів та частота використання певних персонажів можуть свідчити про систематичні упередження в навчальних наборах, що в свою чергу впливає на творчість та різноманітність генерованих історій.

Цікаво, що подібні випадки обмежень у роботі штучного інтелекту не є поодинокими. Наприклад, у одному з недавніх досліджень було виявлено, що штучний інтелект Google не зміг правильно підрахувати кількість літер у слові "Google". Це свідчить про те, що навіть передові технології можуть стикатися з систематичними помилками, що ставить під сумнів їхню надійність у певних ситуаціях.