Google I/O 2026精華:Gemini 3.5 Flash 與 Gemini Omni 帶來更快更具多模態的創作流程

想像一下用幾句自然語言指令就能把自己「丟入」短片、快速生成互動式網頁界面,或把多種媒體參考融合成一段可編輯的影片。這些就是 Google 在 I/O 2026 的兩個大型主軸 — 更快、更能做事的 Gemini 3.5 Flash,以及主打任意輸入到任意輸出的多模態生成器 Gemini Omni。據 Google Blog 報道,以下為 optiz.hk 為香港讀者整理的重點觀察與使用情境。

Gemini 3.5 Flash:速度與「能做事」並進

Google 表示 Gemini 3.5 Flash 是屬於「action-first」的系列首款模型,強調在保有前沿智能的同時,提供低延遲與高效能的執行。它已在 Google Antigravity(以 agents 為導向的開發平台)、Gemini API(透過 Google AI Studio)以及 Android Studio 上普遍提供。

  • 性能表現:在多個 agentic 與程式碼相關基準上,3.5 Flash 優於先前的 Gemini 3.1 Pro,例如 Terminal-Bench 2.1 得分 76.2%、GDPval-AA 達 1656 Elo、MCP Atlas 為 83.6%。
  • 使用場景:Google 指出它特別適合長期、需多步驟計劃與執行的 agentic 任務,能將本來需要數日或數週的工作縮短為更短時間,且成本比其他 frontier 模型低很多(來源以「通常低於一半成本」描述)。
  • 創作與介面:在多模態能力上,3.5 Flash 建基於 Gemini 3,能產生更豐富的互動式網頁 UI 與圖像輸出。

Google 也提到正在內部使用的 Gemini 3.5 Pro,並預告將在下個月推出(以 I/O 發表當下的時間表為準)。

Gemini Omni:從影片開始的任意輸入到任意輸出

Gemini Omni 是一項更宏大的願景——把任意形式的參考(影像、文字、影片、聲音)轉成統一的可編輯輸出。首波輸出以影片為主。

  • 更好的世界物理理解:Omni 在理解重力、動能、流體動力學等物理力量上有所加強,Google 表示這有助於產生更貼近真實、具說故事性的場景。
  • SynthID 水印:Omni 生成的影片會內嵌 Google 表示為「不可察覺」的 SynthID 數位水印,使用者可透過 Gemini app、Chrome 內的 Gemini 與 Search 驗證內容來源。
  • 輸入與支援:一開始僅支援語音作為音訊參考輸入,其他音頻輸入類型將稍後推出。任何圖像、文字或影片皆可作為參考進行融合與再產生。

實際可用性與整合:Gemini App、Google Flow 與 YouTube

Google 表示 Omni Flash 已向全球 Google AI Plus、Pro 與 Ultra 訂閱者開放,透過 Gemini app 與 Google Flow 提供。對一般創作者來說,YouTube 方面也把 Omni 能力整合進 YouTube Shorts Remix 與 YouTube Create app,並向 18 歲以上用戶免費提供部分功能。

  • 操作體驗:在 Gemini app 可用自然對話式編輯影片,例如套用電影縮放、改背景,或從相機膠卷上傳素材並以內建模板一鍵生成。
  • 創意工具:Google Flow 針對創作工作流程,允許把現實靈感與生成內容混合、循環迭代,Omni Flash 還提升了「角色一致性」,確保人物身份與語調在不同場景保留一致性。
  • YouTube 試玩:在 YouTube Shorts Remix,用戶可選取符合資格的短片、下指令修改(如加入自己),系統會回傳含改動的新版本。

對香港用戶的實務觀察與風險提示

對香港/亞洲讀者來說,有幾點值得留意:

  • 可用性:Google 指出 Omni Flash 與相關功能已向全球特定訂閱者或符合年齡的 YouTube 用戶提供;不過來源沒有逐一列出各地具體限制或本地化時間表,香港使用者若要即時使用仍應以官方在地介面或帳號提示為準。
  • 內容驗證:內建 SynthID 水印與在 Gemini 生態系的驗證途徑是正面做法,但來源未詳述水印的技術細節或偽造防護程度,使用者在分享或接收生成內容時仍應保持審慎。
  • 創作門檻降低:從手機上傳相片/影片、使用模板與對話式指令即可生成專業感作品,對自媒體創作者與廣告短片製作都有吸引力;但也可能加速影像內容泛濫,對版權與道德使用提出挑戰。

總結來說,Google 在 I/O 今年把焦點放在「AI 不只會回答,更會做事」與「任何形式的輸入能轉成高品質輸出」的願景上。Gemini 3.5 Flash 更強調速度與 agent 功能,適合需要大量執行與迭代的開發者與企業應用;Gemini Omni 則把生成媒體推向更具場景感與多模態的方向。對香港讀者來說,關鍵是關注本地可用性與平台驗證機制,同時思考創作與監管的平衡。

資料來源

Google Blog — 100 things we announced at I/O 2026
https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/

Latest articles

spot_imgspot_img

Related articles

spot_imgspot_img