Google I/O 2026: Gemini 3.5 и Gemini Omni — главная тема
Google I/O 2026: Gemini 3.5 и Gemini Omni — главная тема
Google I/O 2026 ясно показал: Google хочет, чтобы Gemini стал чем-то большим, чем просто чат-бот, чем-то большим, чем функция поиска, и чем-то большим, чем семейство моделей. Главной темой мероприятия было движение к агентной экосистеме Gemini, где Gemini 3.5 обеспечивает действия, а Gemini Omni расширяет возможности пользователей по созданию из мультимодального ввода.
Объявления охватывали поиск, Android, инструменты для разработчиков, Google Flow, YouTube, подписки, Workspace, покупки и персональных агентов. Но центральный нарратив было легко определить. Gemini 3.5 Flash — это новый движок Google для быстрых, способных агентов и рабочих процессов кодирования. Gemini Omni — это новая креативная модель Google для генерации и редактирования медиа, начиная с видео.
Вместе они показывают, куда Google движется в области AI в 2026 году: от ответов на запросы к выполнению задач, от статических ответов к интерактивным интерфейсам и от изолированных AI-инструментов к моделям, встроенным в основные продукты Google.
Общая картина с Google I/O 2026
Google представил I/O 2026 как приход более ориентированной на действия эпохи AI. Вместо того чтобы представлять Gemini только как разговорного помощника, компания акцентировала внимание на агентах, инструментах, мультимодальном создании, постоянных рабочих процессах и более глубокой интеграции продуктов.
Официальный обзор I/O выделил два новых направления моделей:
- Gemini 3.5, начиная с Gemini 3.5 Flash, модели, разработанной для передового интеллекта, скорости, кодирования и долгосрочных агентных рабочих процессов.
- Gemini Omni, новая модель, которая может создавать из различных видов ввода, начиная с генерации видео и редактирования видео через Gemini Omni Flash.
Это важно, потому что эти две семейства моделей служат разным, но связанным целям. Gemini 3.5 — это слой действий. Он создан для рассуждений, планирования, использования инструментов, работы с агентами и поддержки продуктов, таких как AI Mode в Поиске, Gemini Spark, Google Antigravity и Управляемые агенты в Gemini API. Gemini Omni — это слой создания. Он создан для превращения текстов, изображений, видео и аудио ссылок в согласованные медиа-выходы.
Другими словами, Google не только пытается выиграть в бенчмарках моделей. Он пытается построить полный операционный слой AI в области продуктивности, разработки программного обеспечения, поиска, покупок и креативной работы.
Gemini 3.5 Flash: Первая модель в новой семье Google 3.5
Gemini 3.5 Flash — это первая модель в серии Gemini 3.5. Google представил ее 19 мая 2026 года и позиционировал как модель, которая сочетает в себе передовой интеллект с действиями.
Эта фраза важна. Google больше не описывает Flash только как быстрый, легкий вариант. Gemini 3.5 Flash представляется как серьезная агентная и кодирующая модель, которая может справляться со сложной, многоступенчатой работой, сохраняя при этом скорость, ожидаемую от линии Flash.
Согласно Google, Gemini 3.5 Flash доступен через:
- Приложение Gemini
- AI Mode в Google Search
- Google Antigravity
- Gemini API в Google AI Studio
- Android Studio
- Платформу Gemini Enterprise Agent
- Gemini Enterprise
Google также сообщил, что Gemini 3.5 Pro уже используется внутри компании и ожидается, что он будет запущен после Flash. Это делает Gemini 3.5 Flash как запуск продукта, так и предварительный просмотр более широкой стратегии Gemini 3.5.
Почему Gemini 3.5 Flash важен
Самое важное утверждение о Gemini 3.5 Flash заключается не просто в том, что он быстрее. Реальное утверждение заключается в том, что он может поддерживать долгосрочную агентную работу.
Традиционные AI-помощники часто лучше всего работают с короткими задачами: ответить на вопрос, резюмировать документ, написать функцию или сгенерировать блок текста. Агентные системы отличаются. Им нужно проверять контекст, составлять планы, вызывать инструменты, писать файлы, проверять результаты и продолжать работу на нескольких этапах. Именно такую работу Google нацеливается выполнять с помощью Gemini 3.5 Flash.
Google утверждает, что Gemini 3.5 Flash превосходит Gemini 3.1 Pro по нескольким бенчмаркам кодирования и агентной работы, включая Terminal-Bench 2.1, GDPval-AA и MCP Atlas. Он также утверждает, что модель значительно быстрее, чем другие передовые модели по скорости вывода. Бенчмарки не следует рассматривать как полную картину реальной производительности, но они показывают направление релиза: Google хочет, чтобы Flash стал стандартной моделью для практических AI-агентов, а не просто для быстрых ответов в чате.
Для разработчиков это один из самых больших выводов из I/O 2026. Gemini 3.5 Flash предназначен для таких задач, как поддержание кодовых баз, создание приложений, автоматизация повторяющихся рабочих процессов, обработка вызовов инструментов и координация подагентов. Это делает его особенно актуальным для команд разработчиков, продуктов AI-кодирования, автоматизации предприятий и внутренних инструментов продуктивности.
Gemini 3.5 и агентная стратегия поиска
Gemini 3.5 Flash также теперь является стандартной моделью для AI Mode в Google Search по всему миру. Это значительный шаг в распределении. Поиск — один из самых важных продуктов Google, и сделать Gemini 3.5 Flash стандартной моделью внутри AI Mode означает, что Google немедленно внедряет новую модель в высокоиспользуемую потребительскую среду.
На I/O 2026 Google описал более широкий сдвиг в AI Search:
- AI Mode превысил 1 миллиард пользователей в месяц.
- Google объединяет AI Обзоры и AI Mode.
- Поиск может использовать текст, изображения, файлы, видео и вкладки Chrome в качестве ввода.
- Google вводит информационных агентов, которые могут отслеживать темы и проекты в фоновом режиме.
- В конечном итоге поиск поможет создать пользовательские мини-приложения для текущих задач.
Здесь Gemini 3.5 Flash становится стратегически важным. Поиск больше не просто место для получения ссылок. Google хочет, чтобы это стало местом, где пользователи могут задавать вопросы, продолжать, сравнивать, отслеживать и действовать. Модель, созданная для быстрых агентных рабочих процессов, является центральной частью этого плана.
Gemini Spark: Персональный агент, построенный на Gemini 3.5
Еще одним важным объявлением I/O 2026 стал Gemini Spark, персональный AI-агент Google. Spark предназначен для работы в фоновом режиме, помощи пользователям в навигации по цифровым задачам и выполнения действий по указанию пользователя.
Google сообщил, что Spark работает на Gemini 3.5 и построен на платформе Google Antigravity. Первый запуск осторожен: Google описал Spark как находящийся на раннем этапе своего продуктового пути, начиная с доверенных тестировщиков, а затем бета-версии для подписчиков Google AI Ultra в Соединенных Штатах.
Spark важен, потому что он показывает, как Google думает, что Gemini 3.5 достигнет повседневных пользователей. Модель предназначена не только для разработчиков, пишущих код. Она также предназначена для управления агентами, которые могут резюмировать ежедневную информацию, управлять задачами, работать через приложения и в конечном итоге выполнять более сложные действия, авторизованные пользователем.
Ключевой момент — это надзор. Google неоднократно подчеркивает, что эти агенты действуют под руководством пользователя и должны проверять с пользователями перед важными действиями. Эта рамка будет важна, поскольку персональные AI-агенты становятся более способными и более глубоко интегрированными с учетными записями пользователей, файлами, календарями, сообщениями и платежными потоками.
Google Antigravity и инструменты для разработчиков
Для разработчиков одним из самых ясных сообщений I/O 2026 было то, что Google ставит Gemini 3.5 Flash в центр своего стека разработки агентов.
Google объявил об обновлениях вокруг:
- Google Antigravity 2.0, отдельного настольного приложения для оркестрации агентов.
- Antigravity CLI, интерфейса, ориентированного на терминал, для создания и запуска агентов.
- Antigravity SDK, который предоставляет разработчикам программный доступ к агентному каркасу.
- Управляемые агенты в Gemini API, где один вызов API может запустить агента в изолированной среде Linux.
- Обновления Google AI Studio, включая генерацию приложений для Android и лучшую передачу в Antigravity.
Управляемые агенты могут быть особенно важны. Google утверждает, что они работают на основе каркаса Antigravity и Gemini 3.5 Flash. Идея заключается в том, чтобы позволить разработчикам создавать агентов, которые могут рассуждать, использовать инструменты, выполнять код и сохранять состояние между взаимодействиями, не создавая всю инфраструктуру самостоятельно.
Это делает Gemini 3.5 Flash более чем просто конечной моделью. Он становится частью платформы для разработчиков для создания агентных приложений.
Gemini Omni: Новая креативная модель Google
Если Gemini 3.5 Flash касается действий, то Gemini Omni касается создания.
Google представил Gemini Omni как новую модель, которая может создавать из любого ввода, начиная с видео. Первый релиз — Gemini Omni Flash, который внедряется в приложение Gemini, Google Flow и инструменты создания, связанные с YouTube Shorts.
Gemini Omni построен вокруг простого, но амбициозного обещания: пользователи должны иметь возможность комбинировать текст, изображения, видео и аудио ссылки, а затем генерировать или редактировать высококачественное видео с помощью естественного языка. Со временем Google говорит, что Omni будет поддерживать больше выходных модальностей, включая изображения и аудио.
Это делает Omni отличным от обычной модели текст-видео. Google представляет его как более широкую мультимодальную систему создания. Он может использовать ссылки, сохранять последовательность персонажей, понимать сцены, редактировать на нескольких этапах и генерировать контент, основанный на мировых знаниях Gemini.
Что может сделать Gemini Omni
Gemini Omni предназначен для создания и редактирования видео в разговорном формате. Вместо использования традиционной временной шкалы редактирования пользователи могут описывать, что они хотят изменить.
Основные возможности включают:
- Генерацию видео из текстовых подсказок.
- Редактирование существующих видео с помощью естественного языка.
- Использование изображений, текста, видео и аудио ссылок.
- Сохранение последовательности персонажей между сценами.
- Применение визуальных стилей, изменений камеры и ссылок на движение.
- Создание видео с более реалистичной физикой и непрерывностью сцен.
- Поддержка персональных цифровых аватаров через инструменты аватаров Google.
Google также подчеркнул, что Omni имеет более сильное интуитивное понимание сил, таких как гравитация, кинетическая энергия и динамика жидкостей. Цель состоит не только в том, чтобы сделать клипы реалистичными, но и в том, чтобы действия внутри них казались более физически согласованными.
Это одна из причин, почему Gemini Omni стал одним из самых больших объявлений на I/O 2026. Генерация видео становится важной конкурентной областью в AI, но практическое редактирование видео все еще сложно для большинства пользователей. Если Omni сможет сделать высококачественное редактирование видео разговорным и основанным на ссылках, это может стать важным креативным инструментом для повседневных пользователей, маркетологов, кинематографистов, педагогов и создателей контента в социальных сетях.
Gemini Omni в приложении Gemini, Google Flow и YouTube
Google запускает Gemini Omni Flash на нескольких платформах, а не оставляет его в одном лабораторном продукте.
В приложении Gemini Omni предоставляет пользователям разговорный способ создания и редактирования видео. Пользователь может загрузить фото или видео, применить шаблоны, изменить фоны, добавить кинематографическое движение или создать персонализированный аватар.
В Google Flow Omni становится частью креативной студии Google. Пользователи Flow могут использовать реальные ссылки, итеративно проходить через подсказки, сохранять персонажей между сценами и комбинировать сгенерированные активы в более широкие креативные проекты. Google также объявил о Flow Agent, который может помочь с многоступенчатой креативной работой, такой как мозговой штурм, генерация вариаций, пакетное редактирование и организация активов.
В YouTube Gemini Omni появляется в Shorts Remix и приложении YouTube Create для подходящих пользователей. Это особенно важная точка распределения, потому что создатели Shorts нуждаются в быстрых, легких инструментах, которые могут ремиксировать существующий контент, добавлять ссылки и быстро производить результаты, которые можно делиться.
Схема знакома: Google не рассматривает Omni как отдельную демонстрацию. Он встраивает модель в продукты, где создание уже происходит.
Безопасность, водяные знаки и проверка контента
Генеративное видео вызывает очевидные вопросы о подлинности, злоупотреблении и доверии. Google решил эту проблему, связав Gemini Omni с инструментами водяных знаков SynthID и проверки контента.
Google утверждает, что видео, созданные с помощью Omni, включают незаметный цифровой водяной знак SynthID. Он также сообщил, что пользователи могут проверять контент через приложение Gemini, Gemini в Chrome и Поиск. На I/O 2026 Google также обсудил более широкую поддержку C2PA Content Credentials, которые предназначены для помощи людям в понимании того, является ли контент оригинальным, измененным или сгенерированным AI.
Эти системы не решат все проблемы доверия вокруг AI-медиа, но они важны, потому что генерация видео становится проще и более реалистичной. По мере того как такие инструменты, как Gemini Omni, достигают потребительских приложений и рабочих процессов YouTube, проверка станет необходимой частью продуктового опыта, а не отдельной политической примечанием.
Почему Gemini 3.5 и Gemini Omni — главная тема
Google I/O 2026 имел много объявлений, но Gemini 3.5 и Gemini Omni выделяются, потому что они определяют два самых больших направления для AI-стратегии Google.
Gemini 3.5 касается действий. Он управляет агентами, инструментами кодирования, поисковыми опытами, созданием приложений, рабочими процессами предприятий и персональными AI-помощниками. Это попытка Google сделать AI более полезным, предоставив ему скорость, способность к планированию и поддержку инструментов, необходимые для выполнения реальных задач.
Gemini Omni касается создания. Он приносит мультимодальное рассуждение Gemini в генерацию и редактирование видео, с дорожной картой к более широким комбинациям ввода и вывода. Это попытка Google сделать креативную работу более разговорной, более осведомленной о ссылках и более доступной.
Вместе эти модели показывают, что Google больше не позиционирует Gemini как один продукт. Gemini становится платформенным слоем:
- В Поиске он помогает пользователям задавать более глубокие вопросы и создавать пользовательские опыты.
- В приложении Gemini он становится более проактивным и агентным.
- В Antigravity он управляет кодирующими агентами и рабочими процессами разработчиков.
- В Gemini API он поддерживает инфраструктуру управляемых агентов.
- В Flow и YouTube он становится креативным движком.
- В продуктах для предприятий он автоматизирует сложную операционную работу.
Вот почему Gemini 3.5 и Gemini Omni стали самой большой историей на I/O 2026. Это не изолированные релизы. Это основа для следующей фазы AI-продуктов Google.
Что это значит для пользователей и разработчиков
Для повседневных пользователей практическое влияние заключается в том, что Gemini станет более заметным в продуктах Google. Поиск будет казаться более разговорным и агентным. Приложение Gemini станет более проактивным. Инструменты создания видео станут более доступными через Gemini Omni. Персональные агенты, такие как Spark, начнут тестировать, сколько работы пользователи готовы делегировать AI.
Для разработчиков Gemini 3.5 Flash — это более актуальная история. Модель доступна через поверхности для разработчиков, а объявления Google о Antigravity и Управляемых агентах предполагают серьезный шаг в инфраструктуру создания агентов. Разработчики должны следить за тем, как цены, лимиты на использование, надежность инструментов, обработка контекста и состояния агентов будут развиваться после запуска.
Для создателей Gemini Omni — это объявление, за которым стоит следить. Если его рабочий процесс редактирования будет хорошо работать в реальных производственных условиях, это может сократить разрыв между идеей, отснятым материалом и готовым видео. Самым важным тестом будет то, сможет ли он сохранить идентичность персонажа, движение, стиль, тайминг и непрерывность сцен между повторными редактированиями.
Для бизнеса история заключается в интеграции экосистемы. Google соединяет Gemini с Поиском, Workspace, Commerce, YouTube, Android, инструментами для предприятий и платформами для разработчиков. Ценность будет исходить не столько от одной функции модели, сколько от того, насколько надежно эти инструменты работают вместе.
Заключительные мысли
Google I/O 2026 был мероприятием, насыщенным AI, но это было не только о больших моделях. Это было о том, чтобы сделать AI более операционным.
Gemini 3.5 Flash дает Google быструю агентную модель для кодирования, поиска, персональных агентов и автоматизации предприятий. Gemini Omni предоставляет Google креативную модель для мультимодальной генерации и редактирования видео. Одна создана для действий. Другая создана для создания. Вместе они формируют самый ясный сигнал с I/O 2026: Google хочет, чтобы Gemini стал интеллектуальным слоем в повседневной цифровой работе.
Следующий вопрос — это исполнение. Если агенты Gemini 3.5 будут достаточно надежными, а инструменты видео Gemini Omni будут достаточно последовательными, Google сможет превратить I/O 2026 в важный поворотный момент для своей экосистемы AI. Если нет, объявления все равно будут запомнены как амбициозные, но рынок будет ждать доказательства в повседневном использовании.
Источники: Официальный обзор Google I/O 2026, Объявление Gemini 3.5, Объявление Gemini Omni, Обновления приложения Gemini, и Основные моменты для разработчиков I/O 2026.
FAQ
Какое было самое большое AI-объявление на Google I/O 2026?
Самая большая AI-история заключалась в сочетании Gemini 3.5 и Gemini Omni. Gemini 3.5 Flash управляет агентными рабочими процессами, кодированием, поиском и инструментами для разработчиков, в то время как Gemini Omni вводит мультимодальное создание и редактирование видео.
Что такое Gemini 3.5 Flash?
Gemini 3.5 Flash — это первая модель в семье Gemini 3.5 от Google. Она предназначена для быстрой, способной агентной работы, включая кодирование, использование инструментов, долгосрочные задачи и AI-опыт продуктов.
Доступен ли Gemini 3.5 Flash сейчас?
Да. Google объявил о Gemini 3.5 Flash 19 мая 2026 года и сообщил, что он доступен через приложение Gemini, AI Mode в Поиске, Google Antigravity, Gemini API в Google AI Studio, Android Studio и продукты Gemini для предприятий.
Что такое Gemini Omni?
Gemini Omni — это новая мультимодальная креативная модель от Google. Она может создавать из различных видов ввода, начиная с генерации видео и редактирования видео через Gemini Omni Flash.
Что может создать Gemini Omni Flash?
Gemini Omni Flash начинается с видео. Он может генерировать и редактировать видео, используя текстовые подсказки, изображения, видео ссылки и поддерживаемые аудио ссылки. Google говорит, что будущие модели Omni будут поддерживать больше типов вывода, включая изображения и аудио.
Где доступен Gemini Omni Flash?
Google сообщает, что Gemini Omni Flash внедряется через приложение Gemini и Google Flow для подписчиков Google AI Plus, Pro и Ultra по всему миру. Он также доступен в YouTube Shorts Remix и приложении YouTube Create для подходящих пользователей.
Как Gemini 3.5 связан с Gemini Spark?
Gemini Spark — это персональный AI-агент Google, и Google говорит, что он работает на Gemini 3.5. Spark предназначен для работы в фоновом режиме под руководством пользователя и помощи в управлении цифровыми задачами.
Почему Gemini 3.5 важен для разработчиков?
Gemini 3.5 Flash является центральным элементом стратегии разработчиков Google, потому что он управляет Antigravity, Управляемыми агентами в Gemini API и агентными рабочими процессами, которые могут рассуждать, использовать инструменты, выполнять код и поддерживать состояние.
Включает ли Gemini Omni водяные знаки?
Да. Google сообщает, что видео, созданные с помощью Omni, включают цифровые водяные знаки SynthID, и компания также расширяет инструменты проверки через Gemini, Chrome, Поиск и C2PA Content Credentials.
Доступен ли Gemini 3.5 Pro?
Пока нет для общего пользования на момент объявления на I/O 2026. Google сообщил, что Gemini 3.5 Pro используется внутри компании и ожидается, что он будет запущен после Gemini 3.5 Flash.