Пишеш текст – отримуєш відео. Розробники ChatGPT презентували нові можливості ШІ

OpenAI презентували нову модель під назвою Sora, яка здатна перетворювати текстові інструкції на відео.

Ця модель дозволяє створювати реалістичні та деталізовані сцени відповідно до запиту. Вона може створювати складні сцени з кількома персонажами, різними рухами та докладними деталями об'єктів та фону.

ШІ застосовує архітектуру, засновану на трансформерах, адаптовану для задач відеогенерації. Цей підхід дозволяє моделі обробляти текстові описи і на їх основі генерувати візуальні уявлення, переходячи від початкового шумового сигналу до послідовності кадрів, відповідних заданому сценарію.

OpenAI також надали доступ до моделі деяким художникам, дизайнерам та режисерам, щоб отримати їх відгуки і побажання для поліпшення моделі. Відзначається, що модель розуміє не тільки тексти команд, а й те, як ці речі функціонують у реальному світі.

OpenAI дуже серйозно ставиться до питання безпеки і проводить ретельне тестування моделі на різні ризики, такі як дезінформація та упередженість. Команда розробників працює над створенням інструментів для виявлення та фільтрації потенційно шкідливого або обманюючого контенту.

Також варто згадати, що провідні компанії в галузі ШІ планують укласти угоду щодо виявлення та маркування контенту, створеного штучним інтелектом, під час цьогорічних виборів. Google, Microsoft, Meta, Adobe, OpenAI і TikTok працюють над технологією, яка допоможе виявити та контролювати зображення, відео та аудіозаписи, створені ШІ.

Читайте також:

  • Маск заявив, що штучний інтелект призведе до вимирання людства
  • Євросоюз дійшов згоди щодо регулювання штучного інтелекту
  • Розробники ChatGPT зробили відкриття, яке може загрожувати людству
  • Як фейки, створені штучним інтелектом, забруднюють інформаційний простір