Самое популярное сейчас

Исчерпан ли потенциал ИИ? Как новый протокол Anthropic меняет правила игры

ШИ-модели и новый протокол Anthropic
Новые подходы в области искусственного интеллекта: влияние протокола Anthropic на будущее технологий.

Современные языковые модели: потолок достигнут

Как сообщает ХВИЛЯ: В интервью с Юрием Романенко директор департамента искусственного интеллекта компании Sponge Анар Лавренов заявил, что современные большие языковые модели (LLM) уперлись в технологический предел. По его словам, ведущие разработчики теперь сосредоточены на создании агентских систем, что позволяет эффективнее применять LLM в разных отраслях. Лавренов отметил, что архитектура трансформеров близка к своему расцвету, и мир ждет новых решений, которые превзойдут нынешние технологии.

Он подчеркнул, что появление GPT 3.5 стало прорывом благодаря переходу от рекуррентных моделей к трансформерам. В этом контексте было упомянуто внедрение компанией Anthropic протокола MCP (Model Context Protocol), который превращает LLM в полноценных помощников. Anthropic, будучи крайне закрытой организацией, осознает, что LLM служат фундаментом для более сложных систем, способных выполнять широкий спектр задач - от написания кода до создания дизайнов.

Ключевые этапы обучения искусственного интеллекта

Процесс обучения ИИ включает три основных этапа:

  • На первом этапе модель на огромном массиве текстов пытается угадать следующее слово. Как пояснил Лавренов, Claude использует технику реструктурированного предобучения, что позволяет модели учиться в режиме вопросов и ответов.
  • Второй этап - обучение с учителем, когда модели показывают вопросы и ожидаемые ответы.
  • Третий этап, называемый alignment (выравнивание) или обучение с подкреплением, наиболее важен для формирования поведения модели.

Лавренов также отметил, что на 90% все модели используют одни и те же данные, а различия между ними кроются в методах обучения. В узких областях расхождения могут достигать 5–10%. Помимо архитектуры, важны способы подачи данных и скорость обучения. Команда Anthropic представила метод оптимизации DPO, который также способствует улучшению моделей.

Анар Лавренов: «LLM достигает своего потолка, и следующий этап развития - совершенствование агентских систем, которые интегрируют LLM в нашу среду взаимодействия».

Эти заявления подчеркивают необходимость адаптации к новым технологиям в сфере ИИ, поскольку компании ищут свежие подходы к использованию LLM. Переключение внимания на агентские системы может указывать на то, что будущее искусственного интеллекта связано с интеграцией и взаимодействием с пользователями, что, в свою очередь, способно изменить способы выполнения множества задач в таких областях, как бизнес, образование и наука. Для русскоязычной аудитории стоит отметить, что подобные тенденции уже активно обсуждаются в отечественных IT-сообществах, где агентские системы рассматриваются как следующий логический шаг после стагнации в развитии чистых языковых моделей.

Читайте также

Реклама