20.05.26

Google представила модели Omni для генерации видео и Flash 3.5 для программирования

Flash 3.5 доступна всем бесплатно

Даша Лейзаренко

следит за нейросетями

Страница автора

На конференции I/O 2026 Google представила новые модели Gemini и обновления ИИ-продуктов.

Среди них — модель для генерации видео Omni, обновление линейки Gemini Flash и не только. Расскажу подробнее.

Модель для генерации видео Gemini Omni Flash

Google объявила о создании нового семейства мультимодальных моделей Gemini Omni, которые могут генерировать текст, видео, картинки и аудио. Пока компания представила только одну из линейки — Gemini Omni Flash для генерации видео.

На входе можно задать любую комбинацию текста, картинок, аудио и видео. На выходе получится ролик. В будущем обещают добавить генерацию изображений и аудио.

Нейросети для генерации видео: 7 простых сервисов с бесплатными опциями

Основная фишка — можно редактировать видео прямо в диалоге с чат-ботом на естественном языке. С помощью текстового запроса меняется окружение, ракурс, стиль, эффекты, но при этом сохраняется консистентность персонажей и сцены.

По заявлению Google, Gemini Omni Flash лучше предыдущих версий понимает физику и использует знания о реальном мире, что позволяет даже на основе коротких промптов делать ролики с контекстом.

Вот несколько роликов, с помощью которых Google продемонстрировала работу модели.

Генерация по двум картинкам и аудио

Генерация с нуля

Информативный ролик про фолдинг белка в стиле стоп-моушен-анимации

Компания также представила функцию создания цифровых аватаров. На основе ролика с пользователем Gemini Omni Flash создаст копию, повторив внешность и голос.

Gemini Omni Flash доступна всем платным подписчикам в чат-боте Gemini и в сервисе для генерации видео Flow. Бесплатно можно попробовать в YouTube Shorts, где модель раскатают с 19 по 26 мая. Доступ для разработчиков и корпораций через API появится в ближайшие недели.

Бесплатный курс Учебника Т⁠—⁠Ж «Как упростить жизнь с помощью нейросетей»

Модель для программирования Gemini 3.5 Flash

Gemini 3.5 Flash назвали самой сильной моделью для программирования и агентных задач — в них она превосходит Gemini 3.1 Pro. По бенчмаркам для оценки работы ИИ-агентов модель приблизилась к GPT-5.5.

По заявлению Google, задачи, на которые у разработчика уходили дни, с 3.5 Flash можно решить в разы быстрее — и в два раза дешевле, чем с другими передовыми моделями. Кроме того, 3.5 Flash создает более точные интерактивные веб-интерфейсы и графику.

Пример интерфейса, который можно создать с 3.5 Flash

Модель доступна в чат-боте Gemini для всех бесплатно и в режиме ИИ в поиске Google. Разработчики и корпорации могут получить доступ по API.

Gemini 3.5 Pro пока тестируют внутри компании. Ее планируют выпустить в июне 2026 года.

Персональный ИИ-агент Gemini Spark

Персональный ИИ-агент Gemini Spark работает на базе 3.5 Flash. Он умеет выполнять задачи от имени пользователя на компьютере и в интернете. Его можно обучить разным навыкам, чтобы он выполнял повторяющиеся действия. Spark также умеет выполнять задачи в фоновом режиме.

Агент также будет подстраиваться под пользователя. В Google заявили, что со временем он лучше начнет понимать предпочтения и стиль работы. Чтобы выполнить какое-либо действие, Spark будет запрашивать подтверждение — например, чтобы отправить письмо.

ИИ-агенты: что умеют нейросети, которые выполняют задачи за человека, и какие уже можно опробовать

Google приводит пример такого сценария использования: Spark может мониторить состояние систем и отслеживать тикеты. Если обнаружит повторяющуюся критическую проблему, то создаст тикет в Jira для разработчиков, подготовит подробный отчет об инциденте и напишет ИТ-менеджеру.

Компания открыла доступ к Gemini Spark некоторым тестировщикам. С 25 мая бета-версия станет доступна подписчикам AI Ultra в США.

Spark составляет письмо. © Google

Обновления чат-бота Gemini

Дизайн Gemini обновили в приложениях и на сайте. Он называется Neural Expressive и отличается плавными анимациями, яркими цветами и тактильной обратной связью.

Ответы стали интерактивнее. Вместо стены текста Gemini теперь собирает ответ с картинками, интерактивными таймлайнами, видео и динамическими графиками.

Добавили персонализированные утренние дайджесты. С помощью функции Daily Brief чат-бота можно настроить так, чтобы он собирал информацию из почты, календаря и других подключенных сервисов, а потом показывал общую сводку. Доступно подписчикам AI Plus, Pro и Ultra и пока только в США.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult