一文看懂谷歌 I/O 2026 的核心发布

发表时间:2026-05-20 16:53


2026 Google I/O 开发者大会落下帷幕。


回顾这半年,AI 圈的热闹好像都跟 Google 没什么关系。


但了解 Google 的人都知道,它就喜欢攒足大招,然后一口气全放出来。


终于,今年的 I/O,来了。


今天小编来给大家分享一下此次 Google 发布了什么新东西。



01

大模型



谷歌正式发布两大全新模型系列:Gemini 3.5 Flash 与 Gemini Omni。


Gemini 3.5 Flash 成为本次更新的绝对主力,在编程能力、多模态理解与 Agent 任务三大核心维度的基准测试中,全面超越上一代旗舰模型 Gemini 3.1 Pro。


其推理速度达到同类前沿大模型的 4 倍,在 Agent 专项基准测试 MCP Atlas 上更是取得了 83.6% 的高分,性能超过 GPT-5.5。



定价方面,Gemini 3.5 Flash 输入 $1.50/百万 token,输出 $9.00/百万 token,比 Gemini 3.0 Flash 贵了 3 倍,但比 Gemini 3.1 Pro 便宜40%。


看来全网 token 提价是大势所趋呀。


至于 Gemini 3.5 Pro,他们说:"Giveusuntil nextmonth to getit to you"。


预计将于 6 月正式推出。



Gemini Omni,与谷歌此前推出的 Veo 系列有着本质的定位差异。


Veo 的核心能力聚焦于纯文本生成视频;而 Gemini Omni 实现了真正的全模态交互 —— 它支持图片、音频、视频、文本的任意组合输入,同时具备视频生成与实时编辑的双重能力。


你只需上传一段原始素材,通过自然语言指令即可修改视频中的人物、背景与场景,还支持“局部保留”功能,只修改指定区域而保持其他部分不变,这个很加分。


Omni 能够理解真实世界的物理规律,包括重力、流体动力学等,这使得其生成的视频内容在逻辑与真实感上实现了质的飞跃。



谷歌官方明确表示将对这一功能采取 "谨慎部署" 的策略。毕竟,能够无门槛修改视频中人物与内容的技术,无疑是一个需要审慎对待的潘多拉魔盒。


作为安全保障,目前所有由 Omni 生成的视频都会自动嵌入谷歌的 SynthID 数字水印,用于内容溯源。


截至今日,Gemini Omni Flash版本已通过 Gemini 官方 App、Google Flow 及 YouTube Shorts 平台开始分阶段推送。




02

Agent



这次 Google 更新了几个 Agent。


第一个是 Gemini Spark,你可以理解为 Google 版 OpenClaw。


Gemini Spark 是谷歌推出的个人 AI 代理,运行在谷歌云的虚拟机上,可以 24 小时不间断运转,不需要你一直开着电脑。


它由 Gemini 3.5 Flash 与 Antigravity harness 联合驱动,能够稳定处理长链路、高复杂度的异步后台任务。


并且,Spark 已深度打通 Google 全生态产品,能够无缝接管你的数字事务。


在工作场景中,它能自动梳理你的 Google Docs 文档、Gmail 邮件与聊天记录,提炼核心信息,并严格按照你预设的写作风格自动起草邮件。


在生活场景中同样表现出色。例如你在筹备街区派对时,Spark 会在 Google Sheets 中生成实时 RSVP 追踪表,并与 Gmail 实现双向联动 —— 邻居回复 "我将出席" 时表格会自动更新,对于未回复的联系人,它还会自动生成个性化提醒并完成发送。


太方便了哈哈。



第二个 Agent 则是 Antigravity 2.0 版本上线。


Antigravity 是谷歌投入24 亿美元打造的战略级产品,上面说的 Spark 也是构建在 Antigravity 平台之上的。该产品于去年11月首次上线,这次 I/O 迎来它的更新迭代。


第一,它有了全新独立桌面应用,这跟之前是个IDE插件不一样了,是个真正的 Agent 工作环境了。



第二,它上线了 Antigravity CLI,这其实就是直接把 Gemini CLI 给替代了。


Google 官方公告,2026年6月18日之后,Gemini CLI 和 Gemini Code Assist IDE 扩展会停止对 Pro/Ultra 用户服务。


若你是使用 Gemini CLI 的开发人员,请记得提前迁移到 Antigravity CLI。


第三,同步推出 Antigravity SDK,开发者可以把Google用在 Antigravity 里的 agentharness,直接拿到自己的服务器上跑。


第四,它整合 了 Gemini音频模型,跟Android、 Firebase、 AI Studio都打通了。


工程师在现场演示了一下,让 Antigravity 配合Gemini 3.5 Flash,全程通过自然语言指令,从零构建一个可运行的操作系统。


能跑命令行,能跑doom游戏,可以放动画,非常有意思。


值得关注的是,Gemini 3.5 Flash 在 Antigravity 平台上获得了专属深度优化,其推理速度并非此前公布的行业平均 4 倍,而是达到了惊人的 12倍。


Antigravity 2.0 已全球开放,所有人今天都能用。





03

Google 搜索



AI Mode 月活已经突破10亿,自上线以来每个季度查询量翻一倍。


本次大会,谷歌正式宣布搜索底层模型全面升级为 Gemini 3.5。


1

重做搜索框



Google 表示,这是搜索框25年以来最大的一次升级。


以前你只能打字问问题,现在你可以丢图片、文件、视频进去,搜索会跨模态一起理解。


而且它会用AI帮你补全问题,帮你把真正想问的问题梳理出来。



2

Search Agents



Search 里可以创建 Agent 功能了。你输入你的需求,它能实现 24 小时自动蹲守全网,找到合适的房子、球鞋联名款主动推送给你。


你还能在 Search 里同时启动多个 Agent,

比如写代码生成专属小工具、健身追踪仪表盘等等。


谷歌想让 Search 变成一个会主动送情报上门的私人助理,而不只是你问它才答的工具。


谷歌 CEO 桑达尔・皮查伊在演讲中表示:"搜索已经越来越不像是一次 ' 查完就走 ' 的单次交互,而更像是一段持续进行的、有上下文的对话。"


3

Agentic Coding 进入搜索



它能够针对用户的每一个问题,实时从零构建完全定制化的交互式界面。


这一能力的底层正是由 Antigravity 平台提供支撑。


当用户发起搜索时,系统会自动启动一个独立的容器化智能体运行环境,调用 Gemini 3.5 Flash 实时编写代码、执行代码,并将最终渲染完成的交互式组件直接嵌入到搜索结果页面中。


这项功能将于2026 年夏季面向所有用户免费开放。


在搜索结果中直接嵌入动态生成式 UI,很可能是谷歌搜索自 1998 年诞生以来,产品形态层面最重大的一次进化。



04

智能穿戴


谷歌联合三星与高通共同打造的Android XR 统一平台正式亮相,首款落地产品 ——AI 音频眼镜将于2026 年秋季率先上市。


这款眼镜主打 "抬头式免手交互" 体验,用户只需喊出 "Hey Google" 即可唤醒 Gemini,实现周边信息查询、实时步行导航、语音收发消息与音乐播放,更支持第一视角拍照并由 AI 即时处理分析。


为彻底摆脱智能眼镜 "科技实验品" 的刻板印象,谷歌特别携手 Gentle Monster 与 Warby Parker 两大时尚品牌打造外观,分别推出前卫潮流与经典日常两种设计风格。


后续还将推出搭载单目 microLED 显示屏的进阶版本,且全系列产品将同时兼容 Android 与 iPhone 双平台。


从产品路线来看,谷歌这套打法与 Meta Ray-Ban 智能眼镜高度相似,但核心差异在于其背后完整的 Gemini 生态支撑,理论上能提供更强大的 Agent 级智能服务能力。


这场智能穿戴领域的巅峰对决,将在今年秋天正式拉开帷幕。




05

Agent 电商



Google 正式推出Universal Cart 通用购物车,这是一款基于全新开源通用商务协议 UCP 打造的跨平台 AI 购物解决方案,亚马逊、Meta、微软、Salesforce 等行业巨头均已加入该协议生态。


你在谷歌搜索、Gmail、YouTube 甚至任意网页看到心仪商品时,都可以一键加入这个统一购物车并完成一站式结账。


它会在后台自动监测价格波动、追踪历史价格走势、设置补货提醒,更能智能识别商品兼容性问题 —— 在现场演示中,当用户将不匹配的主板和 CPU 加入购物车时,系统立即发出提醒并给出了替代方案。



写在最后。


谷歌 CEO 桑达尔・皮查伊在本次大会上公布了一组震撼行业的算力数据:两年前,谷歌全球大模型每月处理的 token 量为 9.7 万亿;去年 I/O 大会时,这一数字已飙升至 480 万亿;而今天,这个数字达到了3.2 千万亿—— 短短一年时间实现了 7 倍的指数级增长。


"我从未想过有一天会在 I/O 的演讲台上说出 ' 千万亿 ' 这个单位。" 皮查伊的感慨道出了 AI 行业发展的惊人速度。


规模已至,速度已备,方向也无比清晰。坦率地说,本届 I/O 谷歌发布的产品数量远超以往,但所有发布都指向同一个核心战略:彻底跑通 Agent 生态闭环,将 Gemini 的能力渗透到用户数字生活的每一个角落。


当 AI 真的能够 7×24 小时在后台不间断地替你处理事务时,你准备让它为你做什么?这个问题,或许比 "谷歌今天发布了什么" 更值得我们每一个人深思。



Nebula Data 星雲數據,总部位于新加坡,在雅加达、广州、上海、香港设有分支机构。公司自主研发 Nebula Lab 一站式 AI 内容生成与模型聚合平台,搭载企业级 AI Agent,聚合全球通用大模型与行业垂直模型;同步推出 Nebula AIoT 硬件生态体系(含智能交互终端、物联网网关等产品),形成 “云 - 边 - 端” 全链路智能解决方案,为电商、制造、零售等多领域客户提供从云端算力支撑、AI 智能决策到终端场景落地的一体化服务;同时提供全球 AIDC(AI 智算中心)+ 低延迟网络服务,以技术底座赋能企业拥抱 AI、链接物理世界,拓展全球业务。