过去 18 个月,语音点餐在餐厅迅速成熟。从 Alexa Show 桌面屏幕到内置 Whisper 解决方案,顾客无需阅读菜单即可下单。本文回顾现状、可访问性收益及尚存的技术障碍。
现状
三条路径:设备(Alexa、Google Home)、Web(菜单中的麦克风按钮)、电话 IVR。
thMenu 等使用 Web Speech API 捕获音频、发送到 Whisper、更新购物车。延迟 1.5-2.5 秒。
可访问性的真正胜利
对视障顾客来说是第一个真正的纸质菜单替代方案,比屏幕阅读器顺畅。老年人也受益:"今天有什么?"比和字号搏斗自然。
识别挑战
地方菜名困难。"宫保鸡丁"在英文模型几乎都识别错。解决:选对语言模型 + 自定义菜名词典。
噪音:繁忙酒吧 SNR 降到 5-10 dB,准确度降至 85%。
隐私
音频敏感。仅按下按钮后捕获;原始音频在 30 分钟内删除。需明确告知合规。
五年展望
本地 AI 把延迟降到 300 ms 以下。语音点餐可能成为标准。thMenu 试点反馈积极,错误率下降 30%。
从可访问性开始——最稳妥的投资。
觉得有用?分享给朋友。