Kafe na plyazhe v Akcaabate: gost derzhit rozhok s morozhenym dvumya rukami i ne mozhet kosnutsya telefona. On govorit "zakazhi ayran i hleb" — i brauzer delayet ostalnoye. Bez ustanovki prilozheniya, tolko QR i razresheniye mikrofona.
ASR pryamo v brauzere
Chrome i Safari soderzhat SpeechRecognition s lang="ru-RU" ili "tr-TR". Tekst gotov za 1,2 sekundy bez zagruzki modeley.
Tekst otpravlyayetsya v LLaMA 3.1 8B na Cloudflare Workers AI s JSON-shemy. KV-kesh sokrashchayet povtornyye zaprosy do 50 ms.
Razresheniye dvuznachnosti
"Ayran" napitok protiv "ayran corbasi" sup: NLU zadayet odin vopros i pokazyvayet dve kartochki. Slovo ili tap zakryvayet vopros.
- Regionalnyye aktsenty s fuzzy threshold 0,85
- Allergeny: "bez arakhisa" — otritsatelnyy slot
- Kolichestva: "polovina porcii" — 0,5 v korzine
Dostupnost i fallback
Slabovidyashchie gosti vyigryvayut bolshe vsego: aria-live="polite" i TTS zachityvayut korzinu. Bez WebSpeechAPI menyu tikho perehodit v rezhim taskaniya.
Golos — bonus, a ne hrupkaya zavisimost.
FAQ
Skolko stoit? WebSpeechAPI besplatno; Workers AI okolo 0,01 USD za 1000 zaprosov.
Kakoy tarif? Pro i Platinum vklyuchayut golosovyye zakazy.
V shumnoy obstanovke? Vyshe 65 dB tochnost padayet, no tap vsegda dostupen.
Было полезно? Поделитесь.
Похожие статьи
Статический QR vs динамический QR: сравнение TCO за 3 года
Бистро на 24 столика: 21 000 TRY на перепечатки против 11 640 TRY за динамическу…
Омотэнаси и QR: японское гостеприимство без потери человечности
Почему Sukiyabashi Jiro в Токио отказывается от QR-меню, а 68% средних идзакай п…
AR-предпросмотр блюд через WebXR: 3D в браузере без приложения
Как Dishoom Soho достиг +22% к среднему чеку благодаря model-viewer. Оптимизация…