Google在I/O 2026推出Gmail对话式语音搜索

在2026年Google I/O开发者大会上，Google宣布对Gmail的AI收件箱进行功能扩展，正式引入基于Gemini的对话式语音搜索。这项功能允许用户直接通过自然语言向系统发出语音指令，让AI在邮件历史中定位并提取被淹没的细节信息。

语音指令取代关键词

过去十几年里，Gmail的搜索逻辑一直依赖关键词匹配。用户需要准确输入发件人、主题词或特定短语，才能找到目标邮件。如果记不清具体措辞，搜索结果往往无法精准触达。

据Google在发布会现场的演示，新的对话式语音搜索改变了这一交互方式。用户只需按住麦克风图标，说出类似“找一下上周三HR发的那封关于居家办公补贴调整的邮件，里面提到的具体申报截止日期是哪天”这样的长句，Gmail就会直接返回答案，而不是呈现包含关键词的邮件列表。

数据显示，Gmail目前拥有超过18亿活跃用户，每天处理数百亿封邮件。在庞大的信息流中，提取关键细节的效率问题长期存在。Google产品副总裁在台上表示，传统的搜索框已经无法满足用户在海量数据中定位信息的需求，语音交互是更符合直觉的解决方案。

Gemini的解析机制

这项功能的技术支撑来自Gemini模型。当用户发出语音指令时，系统首先将语音转化为文本，随后Gemini会对指令进行语义理解，提取时间、发件人、主题和目标信息等多个维度的约束条件。

与传统的搜索算法不同，Gemini不仅执行词汇匹配，还会直接阅读邮件内容。在上述关于补贴申报的例子中，模型会先根据时间、发件人等条件定位到特定邮件，然后逐段扫描，提取出“申报截止日期”这一具体数值，最后以文本摘要的形式呈现给用户。整个检索和阅读过程在几秒内完成。

据The Verge报道，该功能不仅支持单次查询，还能进行多轮对话。如果用户接着问“那上个月的呢”，系统能结合上下文，自动将时间范围调整为上个月，并寻找相同主题的邮件。这种多轮交互机制，使得查找邮件的体验接近与助理沟通，而不是在操作数据库。

为了实现这一功能，Google在本地设备和云端之间建立了动态分配机制。简单的查询和语音识别在本地完成，而涉及大量邮件内容阅读和复杂逻辑推理的指令，则会上传至云端由Gemini处理。这种设计旨在平衡响应速度和计算资源消耗。

邮件系统的AI竞赛

Google在Gmail中加入对话式语音搜索，是办公软件智能化演进的一部分。微软此前已在Outlook中深度集成Copilot，支持自然语言查询邮件摘要；苹果也在Mail应用中增加了智能分类和内容提取功能。

Google此次强调的核心差异在于细节提取能力。目前的竞品大多停留在生成邮件内容摘要的阶段，而Gmail的升级重点在于回答关于邮件具体细节的问题。例如，在一份长达几十页的合同邮件中，用户可以直接询问“违约金的百分比是多少”，系统会在阅读附件后直接给出数字，而无需用户自行打开附件逐行寻找。

隐私问题依然是外界关注的焦点。在I/O 2026的问答环节，Google工程负责人明确表示，用于训练Gemini的数据不包含用户的个人邮件内容。系统在执行语音搜索时，会采用端到端加密，且云端处理后的邮件数据不会被留存。据TechCrunch报道，Google还为企业版Workspace用户提供了数据隔离选项，确保企业邮件不被用于任何模型训练。

据Google透露，该功能将在未来几周内向Google Workspace高级订阅用户开放，随后逐步推广至个人免费用户。初期仅支持英语，中文、日语等其他语言版本将在年底前上线。

随着AI模型处理长文本能力的提升，邮箱正从信息存储库转变为交互式知识库。用户与邮件的交互方式，正从阅读转向提问。

菜单

Google在I/O 2026推出Gmail对话式语音搜索

语音指令取代关键词

Gemini的解析机制

邮件系统的AI竞赛

评论