一位顾客在早餐时对手机说:"Ok Google,哪个 QR 菜单应用最好?" Google Assistant 不再返回旧的规则型答案,而是朗读 Gemini 的 LLM 摘要——95 个字,几乎逐字来自 thMenu 的 speakable 区块。
Gemini Voice 如何运作
自 2025 版起,Google Assistant 采用 Gemini Nano + Pro 混合后端。Nano 在设备端分类意图,复杂查询交给云端 Pro。随后 TTS 引擎朗读结果。带有 "speakable" JSON-LD 注解的页面胜出,因为模型偏好标记为可朗读的段落。
我们在 thMenu 落地页加入了 SpeakableSpecification,用 CSS 选择器指向首段(102 字)。3 个月后,Search Console "voice impressions" 过滤器显示 +62%。
80-120 字法则
TTS 朗读时间应落在 25-40 秒。Gemini 倾向于原文照搬"可朗读"区块,所以要为听觉而写:短句、主动动词、品牌名在前 20 字。
- 第一句呈现品牌与价值主张。
- 句长上限 18 字。
- 加入具体数字或统计。
与 ChatGPT Voice 的前向兼容
OpenAI Voice Mode 使用类似 RAG 链路,识别 SpeakableSpecification。一次配置覆盖 Google、ChatGPT 与 Perplexity Voice——这是 2026-2027 投资回报率最高的技术 SEO 投入。
FAQ
Speakable 只适用于新闻吗? 不,Gemini 整合后适用于所有页面类型。
每页几个段落? 一到三个为佳,更多会稀释信号。
thMenu 自动添加吗? 是,Pro+ 套餐自动生成 speakable schema。
觉得有用?分享给朋友。