Gemini теперь сможет превращать фотографии в видео
Компания Google официально представила новую функцию в рамках своего искусственного интеллекта Gemini — теперь пользователи могут превращать фотографии в восьмисекундные видеоролики со звуком. Инструмент работает на базе видеомодели Veo 3 и уже стал доступен подписчикам Gemini Ultra и Pro в ряде регионов.
Новая функция позволяет загружать изображение и описывать, какое движение и атмосферу должен создать ИИ. Помимо визуальной анимации, искусственный интеллект добавляет фоновые шумы, речь и звуковые эффекты, которые, как обещает компания, будут "идеально синхронизированы с визуальным рядом".
Готовый ролик сохраняется в формате MP4 с разрешением 720p и соотношением сторон 16:9, а все видео обязательно содержат водяные знаки — как видимые, так и невидимые (SynthID), подтверждающие их искусственное происхождение.
Для доступа к функции необходимо: нажать "Инструменты" в панели Gemini, выбрать "Видео", загрузить изображение и ввести текстовое описание, при желании — добавить аудиодескрипции для фона, диалогов и эффектов.
Google также сообщил, что Flow, другой инструмент генерации фильмов на базе ИИ, теперь доступен еще в 75 странах. В отличие от Flow, новая функция Gemini работает непосредственно в интерфейсе помощника. Это делает ее более доступной и быстрой в использовании.