아침 식사 중 손님이 휴대폰에 말했다: "Ok Google, 가장 좋은 QR 메뉴 앱은?" Google Assistant는 더는 옛 규칙 기반 응답을 주지 않고 Gemini의 LLM 요약을 읽어주었다 — 95단어, thMenu의 speakable 블록에서 거의 그대로.
Gemini Voice 작동 방식
2025 버전부터 Google Assistant는 Gemini Nano + Pro 하이브리드 백엔드를 사용한다. Nano는 디바이스에서 의도를 분류하고, 복잡한 쿼리는 클라우드 Pro로 간다. 이어 TTS 엔진이 답을 읽는다. "speakable" JSON-LD 주석이 있는 페이지가 유리한데, 모델이 음독에 적합한 단락을 우선시하기 때문이다.
thMenu 랜딩에 SpeakableSpecification을 추가하고 CSS 셀렉터로 첫 단락(102단어)을 지정했다. 3개월 후 Search Console의 "voice impressions" 필터가 +62%를 보였다.
80-120 단어 규칙
TTS 읽기 시간은 25-40초가 적절하다. Gemini는 "읽을 수 있는" 블록을 거의 그대로 인용하므로 귀를 위해 써야 한다: 짧은 문장, 능동 동사, 브랜드명은 첫 20단어 안에.
- 첫 문장에 브랜드와 가치 제안.
- 문장 길이 최대 18단어.
- 숫자나 통계 포함.
ChatGPT Voice 호환
OpenAI Voice Mode도 비슷한 RAG 체인을 쓰며 SpeakableSpecification을 인식한다. 한 번의 설정으로 Google, ChatGPT, Perplexity Voice를 동시에 커버 — 2026-2027 ROI가 가장 높은 기술 SEO 투자다.
FAQ
Speakable은 뉴스 전용 아닌가? 아니다. Gemini 통합 이후 모든 페이지 유형에 적용된다.
페이지당 몇 개? 1-3개가 적당. 더 많으면 신호가 희석된다.
thMenu가 자동 추가? 그렇다. Pro+에서 speakable 스키마가 자동 생성된다.
도움이 되셨나요? 공유해 주세요.
관련 기사
정적 QR vs 동적 QR: 3년 총소유비용 비교
24테이블 비스트로 36개월 실측: 재인쇄 21,000리라 vs 동적 구독 11,640리라. 6개월차 손익분기.…
오모테나시와 QR: 인간미를 잃지 않는 일본식 환대
도쿄 스키야바시 지로가 QR 메뉴를 거부하는 이유와 2024년 중급 이자카야 68%가 도입한 이유. 일본 하이브리드 모델의 핵심.…
WebXR로 음식 AR 미리보기: 앱 없이 브라우저 3D
런던 소호의 Dishoom이 model-viewer로 객단가 22% 상승을 달성한 방법. 200KB 이하 .glb 최적화와 월 몇 센트의 R2 …