Google在I/O 2026推出Gmail对话式语音搜索

发布于 2026年05月20日

在2026年Google I/O开发者大会上,Google宣布对Gmail的AI收件箱进行功能扩展,正式引入基于Gemini的对话式语音搜索。这项功能允许用户直接通过自然语言向系统发出语音指令,让AI在邮件历史中定位并提取被淹没的细节信息。

语音指令取代关键词

过去十几年里,Gmail的搜索逻辑一直依赖关键词匹配。用户需要准确输入发件人、主题词或特定短语,才能找到目标邮件。如果记不清具体措辞,搜索结果往往无法精准触达。

据Google在发布会现场的演示,新的对话式语音搜索改变了这一交互方式。用户只需按住麦克风图标,说出类似“找一下上周三HR发的那封关于居家办公补贴调整的邮件,里面提到的具体申报截止日期是哪天”这样的长句,Gmail就会直接返回答案,而不是呈现包含关键词的邮件列表。

数据显示,Gmail目前拥有超过18亿活跃用户,每天处理数百亿封邮件。在庞大的信息流中,提取关键细节的效率问题长期存在。Google产品副总裁在台上表示,传统的搜索框已经无法满足用户在海量数据中定位信息的需求,语音交互是更符合直觉的解决方案。

Gemini的解析机制

这项功能的技术支撑来自Gemini模型。当用户发出语音指令时,系统首先将语音转化为文本,随后Gemini会对指令进行语义理解,提取时间、发件人、主题和目标信息等多个维度的约束条件。

与传统的搜索算法不同,Gemini不仅执行词汇匹配,还会直接阅读邮件内容。在上述关于补贴申报的例子中,模型会先根据时间、发件人等条件定位到特定邮件,然后逐段扫描,提取出“申报截止日期”这一具体数值,最后以文本摘要的形式呈现给用户。整个检索和阅读过程在几秒内完成。

据The Verge报道,该功能不仅支持单次查询,还能进行多轮对话。如果用户接着问“那上个月的呢”,系统能结合上下文,自动将时间范围调整为上个月,并寻找相同主题的邮件。这种多轮交互机制,使得查找邮件的体验接近与助理沟通,而不是在操作数据库。

为了实现这一功能,Google在本地设备和云端之间建立了动态分配机制。简单的查询和语音识别在本地完成,而涉及大量邮件内容阅读和复杂逻辑推理的指令,则会上传至云端由Gemini处理。这种设计旨在平衡响应速度和计算资源消耗。

邮件系统的AI竞赛

Google在Gmail中加入对话式语音搜索,是办公软件智能化演进的一部分。微软此前已在Outlook中深度集成Copilot,支持自然语言查询邮件摘要;苹果也在Mail应用中增加了智能分类和内容提取功能。

Google此次强调的核心差异在于细节提取能力。目前的竞品大多停留在生成邮件内容摘要的阶段,而Gmail的升级重点在于回答关于邮件具体细节的问题。例如,在一份长达几十页的合同邮件中,用户可以直接询问“违约金的百分比是多少”,系统会在阅读附件后直接给出数字,而无需用户自行打开附件逐行寻找。

隐私问题依然是外界关注的焦点。在I/O 2026的问答环节,Google工程负责人明确表示,用于训练Gemini的数据不包含用户的个人邮件内容。系统在执行语音搜索时,会采用端到端加密,且云端处理后的邮件数据不会被留存。据TechCrunch报道,Google还为企业版Workspace用户提供了数据隔离选项,确保企业邮件不被用于任何模型训练。

据Google透露,该功能将在未来几周内向Google Workspace高级订阅用户开放,随后逐步推广至个人免费用户。初期仅支持英语,中文、日语等其他语言版本将在年底前上线。

随着AI模型处理长文本能力的提升,邮箱正从信息存储库转变为交互式知识库。用户与邮件的交互方式,正从阅读转向提问。



评论