UA RU EN

Google Gemini научился сочинять музыку по описанию или картинке

Искусственный интеллект Google Gemini теперь способен создавать музыкальные произведения, основываясь на текстовых описаниях или изображениях.

Новые творческие способности ИИ от Google

В среду, 18 февраля, Google представил масштабное обновление для своего искусственного интеллекта Gemini. Теперь система способна генерировать 30-секундные музыкальные композиции, получив лишь текстовую подсказку или загруженное пользователем изображение. Эта функция стала доступна благодаря интеграции специализированной модели Lyria 3, отвечающей за создание оригинальных аудиодорожек. Для многих российских пользователей это станет первым опытом взаимодействия с ИИ-композитором такого уровня.

Нововведение уже начало внедряться в веб-версию Gemini, а в ближайшие дни ожидается его появление и в мобильных приложениях. Система понимает запросы на восьми языках, включая английский, немецкий, испанский и японский. Хотя поддержка русского языка на старте не анонсирована, пользователи из России могут опробовать функцию через англоязычный интерфейс.

Визуальное оформление и защита контента

За создание обложек для сгенерированных треков отвечает отдельная модель Nano Banana. Все аудиофайлы помечаются цифровым водяным знаком SynthID, который позволяет идентифицировать контент, созданный искусственным интеллектом. Разработчики специально запрограммировали модель так, чтобы она не копировала в точности голоса реальных исполнителей, обеспечивая уникальность результата.

Обновление Gemini от Google знаменует собой важный шаг в развитии искусственного интеллекта в сфере музыки и искусства.

Появление инструмента для создания музыки по описанию или картинке открывает новые горизонты для творчества и самовыражения. Это новшество способно оказать влияние на музыкальную индустрию, предоставив композиторам и артистам дополнительные инструменты, а широкой аудитории — возможность легко создавать уникальный контент. Будущее покажет, как эта технология будет адаптирована для различных языковых сред, в том числе и для русскоязычных пользователей.