Plazova kavarna v Akcaabatu: host drzi kornout zmrzliny dvema rukama a nemuze sahnout na telefon. Rekne "objednej ayran a chleba" a prohlizec to zaridi — bez instalace aplikace, jen QR a povoleni mikrofonu.
ASR primo v prohlizeci
Chrome i Safari obsahuji SpeechRecognition s lang="cs-CZ" nebo "tr-TR". Surovy text se vrati za 1,2 sekundy bez stahovani modelu.
Text putuje na LLaMA 3.1 8B na Cloudflare Workers AI s prisnym JSON schematem. KV cache srazi opakovane fraze pod 50 ms.
Reseni nejasnosti
"Ayran" napoj vs "ayran corbasi" polevka: NLU se jednou zepta a ukaze dve karty. Jedno slovo nebo tap stací.
- Regionalni akcenty s fuzzy prahem 0,85
- Alergeny: "bez burskych orisku" jako negativní slot
- Mnozstvi: "pul porce" prevedeno na 0,5
Pristupnost a fallback
Slabozraky zakaznik vyhraje nejvic: aria-live="polite" a TTS prectou kosik. Bez WebSpeechAPI prepne menu na klepani.
Hlas je bonus, ne nutna zavislost.
FAQ
Cena? WebSpeechAPI zdarma; Workers AI asi 0,01 USD za 1000 requestu.
Ktery plan? Pro a Platinum zahrnuji hlasove objednavky.
V hluku? Nad 65 dB pada presnost, tap je vsak vzdy k dispozici.
Bylo to užitečné? Sdílejte to.
Související články
Statický QR vs dynamický QR: srovnání TCO na 3 roky
Bistro s 24 stoly, 36 měsíců: 21 000 TRY na dotisky vs 11 640 TRY dynamické před…
Omotenashi a QR: japonská pohostinnost bez ztráty lidskosti
Proč tokijský Sukiyabashi Jiro odmítá QR menu, zatímco 68% středních izakají je …
AR náhled jídla přes WebXR: 3D v prohlížeči bez aplikace
Jak Dishoom Soho dosáhlo +22% průměrné útraty díky model-viewer. Optimalizace .g…