ШІ-моделі використовують лише 11 слів у 88% своїх історій
Виявлення обмежень мовних моделей штучного інтелекту
Як повідомляє НВ — Техно: 12 червня, 12:00. Дослідники виявили, що мовні моделі штучного інтелекту, такі як GPT-5.4 Mini, Claude Haiku 4.5 та Gemini 3.1 Flash-Lite, у 88% випадків використовують обмежений набір слів при створенні історій. Цей набір складається з 11 слів:
- Lighthouse
- Keeper
- Baker
- Mayor
- Clockmaker
- Fisherman
- Librarian
- Conductor
- Mara
- Elias
- Elara
Найчастіше в історіях з'являється персонаж Еліас, який виконує роль доглядача маяка, і його присутність зафіксована приблизно у двох третинах усіх створених сюжетів.
Увагу на це явище звернув інженер-програміст Деніел Мей, який спільно з дослідниками Сілом Гамільтоном і Девідом Мімно проаналізував близько 20 тисяч історій, створених зазначеними мовними моделями. Незважаючи на частоту появи персонажа Еліаса, дослідники не знайшли доказів, що цей образ надзвичайно часто зустрічається в літературі або навчальних даних. Вони вважають, що причиною його популярності може бути використання набору даних WildChat, що містить мільйони діалогів між людьми та чатботом на базі GPT-3.5.
Факти про персонажа Еліаса Торна
Крім того, видання 404 Media повідомило, що ім'я Еліаса Торна було знайдено серед персонажів фентезійних книжок, а також як ім'я виконавця ембієнт-музики на платформі Amazon. Деніел Мей також виявив, що серед книг, де Еліас Торн вказаний як автор, є довідник про альтернативні методи лікування раку. Ці факти свідчать про те, що популярність персонажа, створеного штучним інтелектом, може бути пов'язана з конкретними даними, на яких базуються моделі.
Дослідження, проведене над мовними моделями штучного інтелекту, підкреслює важливість аналізу даних, на яких ці моделі навчаються. Обмеження у виборі слів та частота використання певних персонажів можуть свідчити про систематичні упередження в навчальних наборах, що в свою чергу впливає на творчість та різноманітність генерованих історій.
Цікаво, що подібні випадки обмежень у роботі штучного інтелекту не є поодинокими. Наприклад, у одному з недавніх досліджень було виявлено, що штучний інтелект Google не зміг правильно підрахувати кількість літер у слові "Google". Це свідчить про те, що навіть передові технології можуть стикатися з систематичними помилками, що ставить під сумнів їхню надійність у певних ситуаціях.
Читайте також

