Google I/O 2026的主题演讲已经结束,桑达尔·皮查伊登台,AI再次成为绝对主角。据The Verge报道,本次大会共释放了13项重要更新,核心基本围绕Gemini模型生态的演进展开。从底层模型到应用层,再到硬件终端,谷歌正在尝试将AI能力嵌入其现有的产品线中。
模型迭代进入半代升级期
本次大会最核心的发布是Gemini 3.5系列模型。谷歌先推出了Gemini 3.5 Flash,并宣布Gemini 3.5 Pro将于下个月跟进。在AI模型的命名惯例中,半代升级通常意味着架构不变基础上的调优与效率提升,而非推翻重来的大改版。
Flash版本主打轻量与低延迟,从即日起,它将取代旧版本,成为Gemini独立应用以及搜索AI Mode的默认模型。这意味着普通用户在搜索框中发起提问时,后台响应的推理引擎已经切换。对于AI搜索而言,延迟是决定用户体验的关键指标。如果生成答案需要等待数秒,用户就会退回传统的网页链接列表。Flash模型的部署,本质上是用更少的计算资源换取更快的首字响应时间。
Pro版本则定位于复杂任务处理,推迟一个月发布或许是为了留出更多时间进行安全校准与测试,确保其在高负载推理场景下的稳定性。这种分批发布的策略,也显示出谷歌在模型商业化落地时的谨慎,优先保证高频基础服务的可用性。
搜索与邮件的AI化改造
模型能力最终需要落地到具体场景。搜索的AI Mode是谷歌目前最重视的试验田。传统的搜索是用户输入关键词然后返回网页链接,而AI Mode正在将其转变为用户提问后由AI总结并生成答案。这种转变对谷歌现有的广告商业模式提出了挑战,但也是必须走的方向。当AI直接给出答案时,包含广告链接的网页点击率必然下降。Gemini 3.5 Flash的接入,旨在降低这种模式每次调用的算力成本,使得大规模部署在经济上变得可行。
Gmail同样迎来了新功能。虽然具体细节尚未完全公开,但方向非常明确:从单纯的邮件收发工具,转变为能够自动处理信息的智能助手。大模型的长上下文窗口技术使得AI能够通读几百封邮件的往来记录,提取关键时间节点和待办事项。当AI能够替用户阅读、分类甚至起草回复时,传统的邮件交互流程就被改变了。
Project Aura与端云协同
除了软件,Project Aura智能眼镜的更新也值得关注。这并非单纯的硬件展示,而是谷歌在端侧AI与云端AI协同上的尝试。智能眼镜的体积限制了电池容量与芯片算力,因此它无法在本地运行千亿参数的大模型,必须依赖手机或云端来处理复杂指令,而本地只负责简单的语音唤醒和图像采集。
Gemini 3.5 Flash的出现,恰好为这种低延迟的云端响应提供了技术支撑。智能眼镜就像是一个轻量级的前端探头,把收集到的视觉和语音数据快速传回云端,再将结果推送到镜片屏幕上。这种端云架构的难点在于网络波动带来的延迟,而轻量级模型能在一定程度上缓解这一问题,加快云端的处理速度。
速度优于参数
纵观这13项更新,谷歌并没有像外界预期的那样直接抛出Gemini 4.0,而是选择了3.5这个半代版本作为主力。这反映出当前大模型发展的一个务实趋势:在参数规模扩大带来的边际收益递减时,优化推理速度和降低部署成本变得更为关键。把Flash模型推到前台作为默认选项,是在算力消耗和用户体验之间寻找平衡点。当数以亿计的搜索请求都由AI接管时,模型运行的每一毫秒和每一分钱,都会被无限放大。谷歌此时的选择,说明行业已经度过了单纯追求跑分和参数规模的阶段,进入了比拼工程化落地能力的深水区。