Google I/O 2026: Gemini 3.5 和 Gemini Omni 是主要故事

大约 16 分钟

Google I/O 2026: Gemini 3.5 和 Gemini Omni 是主要故事

Google I/O 2026 清楚地表明：Google 希望 Gemini 成为不仅仅是一个聊天机器人、搜索功能或模型家族。此次活动的最大主题是朝着 代理性 Gemini 生态系统 的转变，Gemini 3.5 驱动行动，而 Gemini Omni 扩展了用户可以从多模态输入中创造的内容。

公告涵盖了搜索、Android、开发者工具、Google Flow、YouTube、订阅、Workspace、购物和个人代理。但中心叙事很容易识别。Gemini 3.5 Flash 是 Google 用于快速、强大代理和编码工作流的新引擎。Gemini Omni 是 Google 用于生成和编辑媒体的新创意模型家族，首个应用于视频。

它们共同展示了 Google 在 2026 年对 AI 的发展方向：从回答提示到完成任务，从静态响应到互动界面，从孤立的 AI 工具到嵌入 Google 主要产品中的模型。

Google I/O 2026 的大局

Google 将 I/O 2026 定义为一个更具行动导向的 AI 时代的到来。公司不仅仅将 Gemini 作为一个对话助手来展示，而是强调代理、工具、多模态创作、持续工作流和更深层次的产品集成。

官方的 I/O 概述强调了两个新的模型方向：

Gemini 3.5，以 Gemini 3.5 Flash 开始，这是一个为前沿智能、速度、编码和长远代理工作流设计的模型。
Gemini Omni，一个新的模型家族，可以从多种输入中创造，首个应用于通过 Gemini Omni Flash 进行视频生成和视频编辑。

这很重要，因为这两个模型家族服务于不同但相互关联的目的。Gemini 3.5 是行动层。它旨在推理、规划、使用工具、与代理合作，并支持如搜索中的 AI 模式、Gemini Spark、Google Antigravity 和 Gemini API 中的托管代理等产品。Gemini Omni 是创作层。它旨在将文本、图像、视频和音频引用转化为连贯的媒体输出。

换句话说，Google 不仅仅是在争取模型基准。它试图在生产力、软件开发、搜索、购物和创意工作中构建一个完整的 AI 操作层。

Gemini 3.5 Flash：Google 新 3.5 家族中的第一个模型

Gemini 3.5 Flash 是 Gemini 3.5 系列中的第一个模型。Google 于 2026 年 5 月 19 日推出了它，并将其定位为一个结合了 前沿智能与行动 的模型。

这个短语很重要。Google 不再仅仅将 Flash 描述为快速、轻量的选项。Gemini 3.5 Flash 被呈现为一个严肃的代理和编码模型，能够处理复杂的多步骤工作，同时仍然保持 Flash 系列的速度预期。

根据 Google 的说法，Gemini 3.5 Flash 可通过以下方式获得：

Gemini 应用
Google 搜索中的 AI 模式
Google Antigravity
Google AI Studio 中的 Gemini API
Android Studio
Gemini 企业代理平台
Gemini 企业

Google 还表示，Gemini 3.5 Pro 已经在内部使用，并预计将在 Flash 之后推出。这使得 Gemini 3.5 Flash 同时成为产品发布和更广泛的 Gemini 3.5 战略的预览。

为什么 Gemini 3.5 Flash 重要

关于 Gemini 3.5 Flash 的最重要的声明不仅仅是它更快。真正的声明是它可以支持 长远的代理工作。

传统的 AI 助手通常在短任务上表现最佳：回答问题、总结文档、编写函数或生成一段文本。代理系统则不同。它们需要检查上下文、制定计划、调用工具、编写文件、审查结果，并在多个步骤中继续。这正是 Google 针对 Gemini 3.5 Flash 的目标工作。

Google 表示，Gemini 3.5 Flash 在多个编码和代理基准测试中超越了 Gemini 3.1 Pro，包括 Terminal-Bench 2.1、GDPval-AA 和 MCP Atlas。它还表示，该模型在输出速度上显著快于其他前沿模型。基准测试不应被视为现实世界性能的完整图景，但它们确实显示了发布的方向：Google 希望 Flash 成为实用 AI 代理的默认模型，而不仅仅是快速的聊天响应。

对于开发者来说，这是 I/O 2026 的最大收获之一。Gemini 3.5 Flash 旨在处理维护代码库、构建应用程序、自动化重复工作流、处理工具调用和协调子代理等任务。这使得它对软件团队、AI 编码产品、企业自动化和内部生产力工具特别相关。

Gemini 3.5 和代理搜索策略

Gemini 3.5 Flash 现在也是 Google 搜索中 AI 模式的默认模型。这是一个重大的分发举措。搜索是 Google 最重要的产品之一，使 Gemini 3.5 Flash 成为 AI 模式中的默认模型意味着 Google 正在立即将新模型推向高使用率的消费者界面。

在 I/O 2026 上，Google 描述了更广泛的 AI 搜索转变：

AI 模式的月活跃用户已超过 10 亿。
Google 正在将 AI 概述和 AI 模式更紧密地结合在一起。
搜索可以使用文本、图像、文件、视频和 Chrome 标签作为输入。
Google 正在引入信息代理，可以在后台监控主题和项目。
搜索最终将帮助构建用于持续任务的自定义迷你应用体验。

这就是 Gemini 3.5 Flash 变得战略重要的地方。搜索不再仅仅是检索链接的地方。Google 希望它成为用户可以询问、继续、比较、监控和行动的地方。一个为快速代理工作流构建的模型是这一计划的核心。

Gemini Spark：基于 Gemini 3.5 的个人代理

另一个重大的 I/O 2026 公告是 Gemini Spark，Google 的个人 AI 代理。Spark 旨在在后台运行，帮助用户导航数字任务，并在用户指示下采取行动。

Google 表示，Spark 运行在 Gemini 3.5 上，并建立在 Google Antigravity 平台上。首次推出是谨慎的：Google 将 Spark 描述为产品旅程的早期阶段，从受信任的测试者开始，然后在美国为 Google AI Ultra 订阅者推出测试版。

Spark 之所以重要，是因为它展示了 Google 如何认为 Gemini 3.5 将到达日常用户。该模型不仅仅是为编写代码的开发者设计的。它还旨在为能够总结日常信息、管理任务、跨应用工作，并最终处理更复杂的用户授权操作的代理提供动力。

关键点是监督。Google 一再强调，这些代理在用户指示下操作，并应在重大行动之前与用户核对。这种框架在个人 AI 代理变得更强大并与用户帐户、文件、日历、消息和支付流程更深层次连接时将变得重要。

Google Antigravity 和开发者工具

对于开发者来说，I/O 2026 的一个明确消息是 Google 正在将 Gemini 3.5 Flash 放在其代理开发栈的中心。

Google 宣布了以下更新：

Google Antigravity 2.0，一个独立的桌面应用程序，用于编排代理。
Antigravity CLI，一个以终端为主的界面，用于创建和运行代理。
Antigravity SDK，为开发者提供程序化访问代理框架。
Gemini API 中的托管代理，通过单个 API 调用可以在隔离的 Linux 环境中启动代理。
Google AI Studio 升级，包括 Android 应用生成和更好的 Antigravity 交接。

托管代理可能尤其重要。Google 表示，它们由 Antigravity 框架和 Gemini 3.5 Flash 提供支持。这个想法是让开发者创建能够推理、使用工具、执行代码并在交互中保持状态的代理，而无需自己构建所有基础设施。

这使得 Gemini 3.5 Flash 不仅仅是一个模型端点。它成为构建代理应用程序的开发者平台的一部分。

Gemini Omni：Google 的新创意模型家族

如果说 Gemini 3.5 Flash 关注行动，那么 Gemini Omni 则关注创作。

Google 将 Gemini Omni 介绍为一个新的模型家族，可以从任何输入中创造，首个应用于视频。首个发布是 Gemini Omni Flash，它正在向 Gemini 应用、Google Flow 和 YouTube Shorts 相关创作工具推出。

Gemini Omni 的构建围绕着一个简单但雄心勃勃的承诺：用户应该能够结合文本、图像、视频和音频引用，然后通过自然语言生成或编辑高质量视频。随着时间的推移，Google 表示 Omni 将支持更多输出模态，包括图像和音频。

这使得 Omni 与普通的文本到视频模型不同。Google 将其呈现为一个更广泛的多模态创作系统。它可以使用引用、保持角色一致性、理解场景、跨多个回合进行编辑，并生成基于 Gemini 世界知识的内容。

Gemini Omni 可以做什么

Gemini Omni 旨在进行对话式视频创作和编辑。用户可以描述他们想要更改的内容，而不是使用传统的编辑时间线。

主要功能包括：

从文本提示生成视频。
使用自然语言编辑现有视频。
使用图像、文本、视频和音频引用。
在场景之间保持角色一致性。
应用视觉风格、相机变化和运动引用。
创建具有更真实物理效果和场景连贯性的视频。
通过 Google 的头像工具支持个人数字头像。

Google 还强调，Omni 对重力、动能和流体动力学等力量有更强的直观理解。目标不仅是让剪辑看起来真实，而且让其中的动作感觉更具物理一致性。

这也是 Gemini Omni 成为 I/O 2026 最大公告之一的原因之一。视频生成正在成为 AI 的一个主要竞争领域，但对大多数用户来说，实际的视频编辑仍然很困难。如果 Omni 能够使高质量的视频编辑变得对话式和引用驱动，它可能成为日常用户、市场营销人员、电影制作人、教育工作者和社交媒体创作者的重要创意工具。

Gemini Omni 在 Gemini 应用、Google Flow 和 YouTube 中

Google 正在通过多个平台推出 Gemini Omni Flash，而不是将其保留在单一实验室产品中。

在 Gemini 应用 中，Omni 为用户提供了一种对话式创建和编辑视频的方式。用户可以上传照片或视频，应用模板，改变背景，添加电影运动，或创建个性化头像。

在 Google Flow 中，Omni 成为 Google 创意工作室的一部分。Flow 用户可以使用现实世界的引用，通过提示进行迭代，在场景之间保持角色一致性，并将生成的资产组合成更广泛的创意项目。Google 还宣布了 Flow Agent，可以帮助处理多步骤创意工作，如头脑风暴、生成变体、批量编辑和组织资产。

在 YouTube 中，Gemini Omni 出现在 Shorts Remix 和 YouTube Create 应用中，供符合条件的用户使用。这是一个特别重要的分发点，因为 Shorts 创作者需要快速、轻量的工具来重新混合现有内容、添加引用并快速生成可分享的结果。

这种模式是熟悉的：Google 并没有将 Omni 视为一个独立的演示。它将模型嵌入到已经发生创作的产品中。

安全性、水印和内容验证

生成视频引发了关于真实性、误用和信任的明显问题。Google 通过将 Gemini Omni 与 SynthID 水印和内容验证工具联系起来来解决这个问题。

Google 表示，使用 Omni 创建的视频包含不可察觉的 SynthID 数字水印。它还表示，用户可以通过 Gemini 应用、Chrome 中的 Gemini 和搜索来验证内容。在 I/O 2026 上，Google 还讨论了对 C2PA 内容凭证的更广泛支持，旨在帮助人们了解内容是否是原创、修改过的或 AI 生成的。

这些系统不会解决与 AI 媒体相关的所有信任问题，但它们很重要，因为视频生成变得越来越简单和真实。随着像 Gemini Omni 这样的工具进入消费者应用和 YouTube 工作流，验证将成为产品体验的必要部分，而不是单独的政策附注。

为什么 Gemini 3.5 和 Gemini Omni 是主要故事

Google I/O 2026 有许多公告，但 Gemini 3.5 和 Gemini Omni 脱颖而出，因为它们定义了 Google AI 战略的两个最大方向。

Gemini 3.5 关注行动。它为代理、编码工具、搜索体验、应用构建、企业工作流和个人 AI 助手提供动力。这是 Google 试图通过赋予 AI 完成实际任务所需的速度、规划能力和工具支持，使其更有用的尝试。

Gemini Omni 关注创作。它将 Gemini 的多模态推理引入视频生成和编辑，规划更广泛的输入和输出组合。它是 Google 试图使创意工作更具对话性、更具引用意识和更易于访问的尝试。

结合在一起，这些模型表明 Google 不再将 Gemini 定位为单一产品。Gemini 正在成为一个平台层：

在搜索中，它帮助用户提出更深层次的问题并构建自定义体验。
在 Gemini 应用中，它变得更加主动和代理化。
在 Antigravity 中，它为编码代理和开发者工作流提供动力。
在 Gemini API 中，它支持托管代理基础设施。
在 Flow 和 YouTube 中，它成为创意引擎。
在企业产品中，它自动化复杂的操作工作。

这就是为什么 Gemini 3.5 和 Gemini Omni 是 I/O 2026 最大故事线的原因。它们不是孤立的发布。它们是 Google 下一阶段 AI 产品的基础。

这对用户和开发者意味着什么

对于普通用户来说，实际影响是 Gemini 将在 Google 产品中变得更加普遍。搜索将变得更加对话式和代理化。Gemini 应用将变得更加主动。通过 Gemini Omni，视频创作工具将变得更加易于访问。像 Spark 这样的个人代理将开始测试用户愿意将多少工作委托给 AI。

对于开发者来说，Gemini 3.5 Flash 是更直接的故事。该模型通过开发者平台普遍可用，Google 的 Antigravity 和托管代理公告表明在代理构建基础设施方面的重大推动。开发者应关注定价、速率限制、工具可靠性、上下文处理和状态代理环境在发布后的成熟情况。

对于创作者来说，Gemini Omni 是值得关注的公告。如果其编辑工作流在实际生产环境中表现良好，它可能会缩小创意、镜头和成品视频之间的差距。最重要的测试将是它是否能够在重复编辑中保持角色身份、运动、风格、时机和场景连贯性。

对于企业来说，故事是生态系统集成。Google 正在将 Gemini 连接到搜索、Workspace、商业、YouTube、Android、企业工具和开发者平台。价值将来自于这些工具如何可靠地协同工作，而不是来自于单一模型功能。

最后思考

Google I/O 2026 是一个 AI 密集的活动，但它不仅仅是关于更大的模型。它是关于使 AI 更加操作化。

Gemini 3.5 Flash 为 Google 提供了一个快速的代理模型，用于编码、搜索、个人代理和企业自动化。Gemini Omni 为 Google 提供了一个用于多模态视频生成和编辑的创意模型家族。一个是为行动而构建，另一个是为创作而构建。它们共同形成了 I/O 2026 的最清晰信号：Google 希望 Gemini 成为日常数字工作的智能层。

下一个问题是执行。如果 Gemini 3.5 代理足够可靠，Gemini Omni 的视频工具足够一致，Google 可能会将 I/O 2026 转变为其 AI 生态系统的一个重大转折点。如果没有，这些公告仍将被视为雄心勃勃，但市场将等待日常使用中的证明。

来源：Google I/O 2026 官方总结，Gemini 3.5 公告，Gemini Omni 公告，Gemini 应用更新，以及 I/O 2026 开发者亮点。

Google I/O 2026: Gemini 3.5 和 Gemini Omni 是主要故事

Google I/O 2026: Gemini 3.5 和 Gemini Omni 是主要故事

Google I/O 2026 的大局

Gemini 3.5 Flash：Google 新 3.5 家族中的第一个模型

为什么 Gemini 3.5 Flash 重要

Gemini 3.5 和代理搜索策略

Gemini Spark：基于 Gemini 3.5 的个人代理

Google Antigravity 和开发者工具

Gemini Omni：Google 的新创意模型家族

Gemini Omni 可以做什么

Gemini Omni 在 Gemini 应用、Google Flow 和 YouTube 中

安全性、水印和内容验证

为什么 Gemini 3.5 和 Gemini Omni 是主要故事

这对用户和开发者意味着什么

最后思考

常见问题

Google I/O 2026 上最大的 AI 公告是什么？

什么是 Gemini 3.5 Flash？

Gemini 3.5 Flash 现在可用吗？

什么是 Gemini Omni？

Gemini Omni Flash 可以创造什么？

Gemini Omni Flash 在哪里可用？

Gemini 3.5 与 Gemini Spark 有什么联系？

为什么 Gemini 3.5 对开发者很重要？

Gemini Omni 包括水印吗？

Gemini 3.5 Pro 可用吗？