Anthropic пересмотрела политику после скандала с моделью Claude Fable 5
Компания Anthropic признала свою неправоту и внесла коррективы в правила использования модели Claude Fable 5. Ранее выяснилось, что разработчики скрывали от исследователей факт снижения качества ответов при выполнении задач, связанных с созданием конкурирующих ИИ-систем. В официальном заявлении компания извинилась и пообещала впредь уведомлять пользователей об ограничениях, которые всё ещё действуют в модели.
В основе Claude Fable 5 лежит система Mythos, однако у неё были выявлены серьёзные изъяны. При обработке определённых запросов модель незаметно переключалась на менее мощную версию, из-за чего качество ответов падало. Это вызвало недовольство среди исследователей: они тратили токены и деньги, не получая ожидаемого результата, а также сталкивались с отсутствием прозрачности. В частности, модель отказывалась выполнять или значительно ухудшала результаты по таким направлениям, как:
- обучение конкурирующих языковых моделей
- отладка кода для ИИ
- оптимизация нейросетевых архитектур
При этом Anthropic не планирует полностью убирать ограничения из Claude Fable 5.
Реакция сообщества и позиция компании
Исследователь Дин У. Болл прокомментировал: 'Снижение производительности модели для задач машинного обучения без предупреждения пользователей — это крайне недружественный шаг, который наносит урон репутации компании.'
Anthropic сообщила изданию Wired о внесённых изменениях. Компания подчеркнула, что теперь механизмы защиты в Fable 5 будут заметны для пользователей. Разработчики признали, что изначально выбрали неверный подход, и извинились за то, что не смогли найти правильный баланс в своей политике.
Anthropic позиционирует себя как более этичная и лояльная к научному сообществу альтернатива OpenAI, что подразумевает стремление к прозрачности и сотрудничеству. Теперь пользователи будут получать уведомления, если попытаются задействовать модель для создания слишком мощной ИИ-системы. Этот шаг призван улучшить взаимодействие с клиентами и укрепить доверие к продукту.
Ситуация наглядно демонстрирует, насколько важна прозрачность в разработке технологий искусственного интеллекта, особенно когда речь идёт об этике и доверии пользователей. Anthropic, пытаясь исправить ошибки, может восстановить репутацию, если успешно реализует новую политику и наладит эффективную коммуникацию с исследователями. Однако критика со стороны научного сообщества может оставить след на имидже компании, если она не покажет реальных изменений в своей работе. В этой связи стоит внимательно следить за дальнейшими действиями Anthropic и их влиянием на рынок ИИ.
В то время как Anthropic извиняется за недостаточную прозрачность в работе модели Claude Fable 5, стоит обратить внимание на её возможности. Недавний релиз Claude Fable 5 демонстрирует, как новая ИИ-модель обходит предыдущие версии, включая GPT 5.5, что может быть интересным для исследователей и разработчиков, стремящихся использовать передовые технологии в своих проектах.