Google I/O 2026: Gemini 3.5 和 Gemini Omni 是主要故事
Google I/O 2026: Gemini 3.5 和 Gemini Omni 是主要故事
Google I/O 2026 清楚表明:Google 希望 Gemini 成為不僅僅是一個聊天機器人,不僅僅是一個搜索功能,也不僅僅是一個模型家族。此次活動的最大主題是朝向一個 代理型的 Gemini 生態系統,Gemini 3.5 驅動行動,而 Gemini Omni 擴展了用戶可以從多模態輸入創建的內容。
公告涵蓋了搜索、Android、開發者工具、Google Flow、YouTube、訂閱、Workspace、購物和個人代理。但中心敘事很容易識別。Gemini 3.5 Flash 是 Google 用於快速、強大代理和編碼工作流程的新引擎。Gemini Omni 是 Google 用於生成和編輯媒體的新創意模型家族,首要從視頻開始。
這兩者共同展示了 Google 在 2026 年對 AI 的發展方向:從回答提示到完成任務,從靜態回應到互動界面,從孤立的 AI 工具到嵌入 Google 主要產品中的模型。
Google I/O 2026 的大局
Google 將 I/O 2026 定義為一個更具行動導向的 AI 時代的到來。公司不僅僅將 Gemini 呈現為一個對話助手,而是強調代理、工具、多模態創作、持續工作流程和更深層的產品整合。
官方的 I/O 總結突出了兩個新的模型方向:
- Gemini 3.5,以 Gemini 3.5 Flash 開始,這是一個為前沿智能、速度、編碼和長期代理工作流程設計的模型。
- Gemini Omni,一個新的模型家族,可以從多種輸入創建內容,首要從視頻生成和視頻編輯開始,通過 Gemini Omni Flash。
這很重要,因為這兩個模型家族服務於不同但相互連結的目的。Gemini 3.5 是行動層。它旨在推理、計劃、使用工具、與代理合作,並支持像搜索中的 AI 模式、Gemini Spark、Google Antigravity 和 Gemini API 中的管理代理等產品。Gemini Omni 是創作層。它旨在將文本、圖像、視頻和音頻參考轉換為連貫的媒體輸出。
換句話說,Google 不僅僅是在試圖贏得模型基準。它試圖在生產力、軟件開發、搜索、購物和創意工作中建立一個完整的 AI 操作層。
Gemini 3.5 Flash:Google 新 3.5 家族中的第一個模型
Gemini 3.5 Flash 是 Gemini 3.5 系列中的第一個模型。Google 在 2026 年 5 月 19 日介紹了它,並將其定位為一個結合 前沿智能與行動 的模型。
這個短語很重要。Google 不再僅僅將 Flash 描述為快速、輕量的選擇。Gemini 3.5 Flash 被呈現為一個可以處理複雜、多步驟工作的嚴肅代理和編碼模型,同時仍然保持 Flash 系列的速度預期。
根據 Google 的說法,Gemini 3.5 Flash 可通過以下方式獲得:
- Gemini 應用程式
- Google 搜索中的 AI 模式
- Google Antigravity
- Google AI Studio 中的 Gemini API
- Android Studio
- Gemini 企業代理平台
- Gemini 企業
Google 還表示,Gemini 3.5 Pro 已經在內部使用,並預計在 Flash 之後推出。這使得 Gemini 3.5 Flash 同時成為產品發布和更廣泛的 Gemini 3.5 策略的預覽。
為什麼 Gemini 3.5 Flash 重要
關於 Gemini 3.5 Flash 最重要的聲明不僅僅是它更快。真正的聲明是它可以支持 長期代理工作。
傳統的 AI 助手通常在短任務上表現最佳:回答問題、總結文件、編寫函數或生成一段文本。代理系統則不同。它們需要檢查上下文、制定計劃、調用工具、編寫文件、審查結果,並在多個步驟中持續進行。這正是 Google 針對 Gemini 3.5 Flash 的工作類型。
Google 表示,Gemini 3.5 Flash 在幾個編碼和代理基準上超越了 Gemini 3.1 Pro,包括 Terminal-Bench 2.1、GDPval-AA 和 MCP Atlas。它還表示該模型在輸出速度上顯著快於其他前沿模型。基準不應被視為現實世界性能的完整畫面,但它們確實顯示了發布的方向:Google 希望 Flash 成為實用 AI 代理的默認模型,而不僅僅是快速的聊天回應。
對於開發者來說,這是 I/O 2026 的一個重要收穫。Gemini 3.5 Flash 是為維護代碼庫、構建應用程序、自動化重複工作流程、處理工具調用和協調子代理等任務而設計的。這使得它對軟件團隊、AI 編碼產品、企業自動化和內部生產力工具特別相關。
Gemini 3.5 和代理搜索策略
Gemini 3.5 Flash 現在也是 Google 搜索中 AI 模式的默認模型。這是一個重大的分發舉措。搜索是 Google 最重要的產品之一,將 Gemini 3.5 Flash 設為 AI 模式中的默認模型意味著 Google 正在立即將新模型推向高使用率的消費者界面。
在 I/O 2026 上,Google 描述了一個更廣泛的 AI 搜索轉變:
- AI 模式的月活躍用戶已超過 10 億。
- Google 正在將 AI 概述和 AI 模式更緊密地結合在一起。
- 搜索可以使用文本、圖像、文件、視頻和 Chrome 標籤作為輸入。
- Google 正在引入信息代理,可以在背景中監控主題和項目。
- 搜索最終將幫助構建自定義迷你應用體驗以應對持續任務。
這就是 Gemini 3.5 Flash 變得戰略重要的地方。搜索不再僅僅是檢索鏈接的地方。Google 希望它成為用戶可以詢問、繼續、比較、監控和行動的地方。為快速代理工作流程而構建的模型是該計劃的核心。
Gemini Spark:基於 Gemini 3.5 的個人代理
另一個重要的 I/O 2026 公告是 Gemini Spark,Google 的個人 AI 代理。Spark 設計用於在背景中運行,幫助用戶導航數字任務,並在用戶指導下採取行動。
Google 表示 Spark 運行在 Gemini 3.5 上,並建立在 Google Antigravity 平台上。首次推出是謹慎的:Google 將 Spark 描述為產品旅程的早期階段,首先是信任測試者,然後是美國 Google AI Ultra 訂閱者的測試版。
Spark 之所以重要,是因為它展示了 Google 如何認為 Gemini 3.5 將接觸到日常用戶。該模型不僅僅是為編寫代碼的開發者設計的。它還旨在驅動可以總結日常信息、管理任務、跨應用工作,並最終處理更複雜的用戶授權行動的代理。
關鍵點是監督。Google 一再強調,這些代理在用戶指導下運作,並應在重大行動之前與用戶確認。這種框架在個人 AI 代理變得更具能力並與用戶帳戶、文件、日曆、消息和支付流程更深層連接時將變得重要。
Google Antigravity 和開發者工具
對於開發者來說,I/O 2026 的一個明確信息是 Google 正在將 Gemini 3.5 Flash 放在其代理開發堆棧的中心。
Google 宣布了以下更新:
- Google Antigravity 2.0,一個獨立的桌面應用程序,用於協調代理。
- Antigravity CLI,一個以終端為主的界面,用於創建和運行代理。
- Antigravity SDK,為開發者提供程序化訪問代理框架。
- Gemini API 中的管理代理,通過單個 API 調用可以在隔離的 Linux 環境中啟動代理。
- Google AI Studio 升級,包括 Android 應用生成和更好的 Antigravity 交接。
管理代理可能特別重要。Google 表示它們由 Antigravity 框架和 Gemini 3.5 Flash 提供支持。這個想法是讓開發者創建可以推理、使用工具、執行代碼並在交互中保持狀態的代理,而無需自己構建所有基礎設施。
這使得 Gemini 3.5 Flash 不僅僅是一個模型端點。它成為構建代理應用程序的開發者平台的一部分。
Gemini Omni:Google 的新創意模型家族
如果 Gemini 3.5 Flash 是關於行動,那麼 Gemini Omni 就是關於創作。
Google 介紹了 Gemini Omni 作為一個新的模型家族,可以從任何輸入創建內容,首要從視頻開始。首個發布是 Gemini Omni Flash,它正在向 Gemini 應用程式、Google Flow 和 YouTube Shorts 相關創作工具推出。
Gemini Omni 圍繞一個簡單但雄心勃勃的承諾構建:用戶應能夠結合文本、圖像、視頻和音頻參考,然後通過自然語言生成或編輯高質量視頻。隨著時間的推移,Google 表示 Omni 將支持更多輸出模態,包括圖像和音頻。
這使得 Omni 與普通的文本到視頻模型不同。Google 將其呈現為一個更廣泛的多模態創作系統。它可以使用參考、保持角色一致性、理解場景、跨多次編輯進行編輯,並生成基於 Gemini 世界知識的內容。
Gemini Omni 可以做什麼
Gemini Omni 設計用於對話式視頻創作和編輯。用戶不再使用傳統的編輯時間線,而是可以描述他們想要更改的內容。
主要功能包括:
- 從文本提示生成視頻。
- 使用自然語言編輯現有視頻。
- 使用圖像、文本、視頻和音頻參考。
- 在場景中保持角色一致性。
- 應用視覺風格、相機變化和運動參考。
- 創建具有更真實物理效果和場景連貫性的視頻。
- 通過 Google 的虛擬形象工具支持個人數字化身。
Google 還強調 Omni 對重力、動能和流體動力學等力量有更強的直觀理解。目標不僅是讓片段看起來真實,而是讓其中的動作感覺更具物理一致性。
這是 Gemini Omni 成為 I/O 2026 最大公告之一的原因之一。視頻生成正在成為 AI 的一個主要競爭領域,但對大多數用戶來說,實用的視頻編輯仍然很困難。如果 Omni 能夠使高質量的視頻編輯變得對話式和參考驅動,它可能成為日常用戶、營銷人員、電影製作人、教育工作者和社交媒體創作者的一個主要創意工具。
Gemini Omni 在 Gemini 應用程式、Google Flow 和 YouTube 中
Google 正在通過多個平台推出 Gemini Omni Flash,而不是將其保留在單一的實驗室產品中。
在 Gemini 應用程式 中,Omni 為用戶提供了一種對話式創建和編輯視頻的方式。用戶可以上傳照片或視頻,應用模板,改變背景,添加電影運動,或創建個性化的虛擬形象。
在 Google Flow 中,Omni 成為 Google 創意工作室的一部分。Flow 用戶可以使用現實世界的參考,通過提示進行迭代,在場景中保持角色一致性,並將生成的資產結合到更廣泛的創意項目中。Google 還宣布了 Flow Agent,可以幫助進行多步創意工作,例如頭腦風暴、生成變體、批量編輯和組織資產。
在 YouTube 中,Gemini Omni 出現在 Shorts Remix 和 YouTube Create 應用中,供符合條件的用戶使用。這是一個特別重要的分發點,因為 Shorts 創作者需要快速、輕量的工具來重新混合現有內容、添加參考並快速生成可分享的結果。
這種模式是熟悉的:Google 不將 Omni 視為一個獨立的演示。它將模型嵌入到已經進行創作的產品中。
安全性、水印和內容驗證
生成視頻引發了關於真實性、濫用和信任的明顯問題。Google 通過將 Gemini Omni 與 SynthID 水印和內容驗證工具相結合來解決這一問題。
Google 表示,使用 Omni 創建的視頻包含一個不可察覺的 SynthID 數字水印。它還表示,用戶可以通過 Gemini 應用程式、Chrome 中的 Gemini 和搜索來驗證內容。在 I/O 2026 上,Google 還討論了對 C2PA 內容憑證的更廣泛支持,這旨在幫助人們了解內容是否為原創、修改或 AI 生成。
這些系統不會解決所有與 AI 媒體相關的信任問題,但它們很重要,因為視頻生成變得越來越容易和現實。隨著像 Gemini Omni 這樣的工具進入消費者應用和 YouTube 工作流程,驗證將成為產品體驗的必要部分,而不是單獨的政策附註。
為什麼 Gemini 3.5 和 Gemini Omni 是主要故事
Google I/O 2026 有許多公告,但 Gemini 3.5 和 Gemini Omni 脫穎而出,因為它們定義了 Google AI 策略的兩個最大方向。
Gemini 3.5 是關於 執行。它驅動代理、編碼工具、搜索體驗、應用構建、企業工作流程和個人 AI 助手。這是 Google 試圖通過賦予 AI 完成實際任務所需的速度、計劃能力和工具支持來使其更有用的嘗試。
Gemini Omni 是關於 創作。它將 Gemini 的多模態推理引入視頻生成和編輯,並朝著更廣泛的輸入和輸出組合的路線圖發展。這是 Google 試圖使創意工作變得更具對話性、更具參考意識和更易於訪問的嘗試。
綜合起來,這些模型顯示 Google 不再將 Gemini 定位為一個產品。Gemini 正在成為一個平台層:
- 在搜索中,它幫助用戶提出更深層次的問題並構建自定義體驗。
- 在 Gemini 應用程式中,它變得更加主動和代理化。
- 在 Antigravity 中,它驅動編碼代理和開發者工作流程。
- 在 Gemini API 中,它支持管理代理基礎設施。
- 在 Flow 和 YouTube 中,它成為創意引擎。
- 在企業產品中,它自動化複雜的操作工作。
這就是為什麼 Gemini 3.5 和 Gemini Omni 是 I/O 2026 最大的故事線。它們不是孤立的發布。它們是 Google 下一階段 AI 產品的基礎。
這對用戶和開發者意味著什麼
對於日常用戶而言,實際影響是 Gemini 將在 Google 產品中變得更加普遍。搜索將感覺更具對話性和代理性。Gemini 應用程式將變得更加主動。視頻創作工具將通過 Gemini Omni 變得更易於訪問。像 Spark 這樣的個人代理將開始測試用戶願意將多少工作委託給 AI。
對於開發者來說,Gemini 3.5 Flash 是更直接的故事。該模型通過開發者界面普遍可用,Google 的 Antigravity 和管理代理公告表明了對代理構建基礎設施的嚴肅推進。開發者應該關注定價、速率限制、工具可靠性、上下文處理和有狀態代理環境在發布後的成熟情況。
對於創作者來說,Gemini Omni 是值得關注的公告。如果其編輯工作流程在實際生產環境中運行良好,它可能會縮小想法、素材和完成視頻之間的差距。最重要的測試將是它是否能在重複編輯中保持角色身份、運動、風格、時機和場景連貫性。
對於企業來說,故事是生態系統整合。Google 正在將 Gemini 連接到搜索、Workspace、商務、YouTube、Android、企業工具和開發者平台。價值將不僅來自單一模型功能,而是來自這些工具如何可靠地協同工作。
最後的想法
Google I/O 2026 是一個 AI 密集的活動,但它不僅僅是關於更大的模型。它是關於使 AI 更具操作性。
Gemini 3.5 Flash 為 Google 提供了一個快速的代理模型,用於編碼、搜索、個人代理和企業自動化。Gemini Omni 為 Google 提供了一個創意模型家族,用於多模態視頻生成和編輯。一個是為了行動而建,另一個是為了創作而建。這兩者共同形成了 I/O 2026 的最明確信號:Google 希望 Gemini 成為日常數字工作的智能層。
下一個問題是執行。如果 Gemini 3.5 代理足夠可靠,且 Gemini Omni 的視頻工具足夠一致,Google 可能會將 I/O 2026 轉變為其 AI 生態系統的一個重大轉折點。如果沒有,這些公告仍將被記住為雄心勃勃,但市場將等待日常使用中的證明。
來源: Google I/O 2026 官方總結,Gemini 3.5 公告,Gemini Omni 公告,Gemini 應用程式更新,以及 I/O 2026 開發者亮點。
常見問題
Google I/O 2026 上最大的 AI 公告是什麼?
最大的 AI 故事是 Gemini 3.5 和 Gemini Omni 的結合。Gemini 3.5 Flash 驅動代理工作流程、編碼、搜索和開發者工具,而 Gemini Omni 則引入了多模態創作和視頻編輯。
什麼是 Gemini 3.5 Flash?
Gemini 3.5 Flash 是 Google 的 Gemini 3.5 家族中的第一個模型。它旨在用於快速、強大的代理工作,包括編碼、工具使用、長期任務和 AI 驅動的產品體驗。
Gemini 3.5 Flash 現在可用嗎?
是的。Google 在 2026 年 5 月 19 日宣布了 Gemini 3.5 Flash,並表示它可通過 Gemini 應用程式、搜索中的 AI 模式、Google Antigravity、Google AI Studio 中的 Gemini API、Android Studio 和企業 Gemini 產品獲得。
什麼是 Gemini Omni?
Gemini Omni 是 Google 的新多模態創意模型家族。它可以從不同類型的輸入創建內容,首要從視頻生成和視頻編輯開始,通過 Gemini Omni Flash。
Gemini Omni Flash 可以創建什麼?
Gemini Omni Flash 首先專注於視頻。它可以使用文本提示、圖像、視頻參考和支持的音頻參考生成和編輯視頻。Google 表示未來的 Omni 模型將支持更多輸出類型,包括圖像和音頻。
Gemini Omni Flash 在哪裡可用?
Google 表示,Gemini Omni Flash 正在通過 Gemini 應用程式和 Google Flow 向全球的 Google AI Plus、Pro 和 Ultra 訂閱者推出。它還在符合條件的用戶的 YouTube Shorts Remix 和 YouTube Create 應用中可用。
Gemini 3.5 與 Gemini Spark 有什麼關聯?
Gemini Spark 是 Google 的個人 AI 代理,Google 表示它運行在 Gemini 3.5 上。Spark 設計用於在用戶指導下在背景中運行,並幫助管理數字任務。
為什麼 Gemini 3.5 對開發者來說重要?
Gemini 3.5 Flash 是 Google 開發者策略的核心,因為它驅動 Antigravity、Gemini API 中的管理代理,以及可以推理、使用工具、執行代碼和保持狀態的代理工作流程。
Gemini Omni 包含水印嗎?
是的。Google 表示,使用 Omni 創建的視頻包含 SynthID 數字水印,該公司還通過 Gemini、Chrome、搜索和 C2PA 內容憑證擴展驗證工具。
Gemini 3.5 Pro 可用嗎?
在 I/O 2026 公告時尚未對公眾開放。Google 表示 Gemini 3.5 Pro 正在內部使用,並預計在 Gemini 3.5 Flash 之後推出。