Skip to content
FunkceCeníkPartneřiBlogNápovědaO násKontakt
ZačítPřihlásit se
Zpět na Blog
industry2026-08-266 min čtení

Hlasove objednavky primo v prohlizeci pres WebSpeechAPI v kavarnach

Plazova kavarna: host se zmrzlinou v ruce objednava hlasem z prohlizece. Technicky pruvodce WebSpeechAPI a Cloudflare AI NLU.

th

thMenu Team

thmenu.com

Plazova kavarna v Akcaabatu: host drzi kornout zmrzliny dvema rukama a nemuze sahnout na telefon. Rekne "objednej ayran a chleba" a prohlizec to zaridi — bez instalace aplikace, jen QR a povoleni mikrofonu.

ASR primo v prohlizeci

Chrome i Safari obsahuji SpeechRecognition s lang="cs-CZ" nebo "tr-TR". Surovy text se vrati za 1,2 sekundy bez stahovani modelu.

Text putuje na LLaMA 3.1 8B na Cloudflare Workers AI s prisnym JSON schematem. KV cache srazi opakovane fraze pod 50 ms.

Reseni nejasnosti

"Ayran" napoj vs "ayran corbasi" polevka: NLU se jednou zepta a ukaze dve karty. Jedno slovo nebo tap stací.

  • Regionalni akcenty s fuzzy prahem 0,85
  • Alergeny: "bez burskych orisku" jako negativní slot
  • Mnozstvi: "pul porce" prevedeno na 0,5

Pristupnost a fallback

Slabozraky zakaznik vyhraje nejvic: aria-live="polite" a TTS prectou kosik. Bez WebSpeechAPI prepne menu na klepani.

Hlas je bonus, ne nutna zavislost.

FAQ

Cena? WebSpeechAPI zdarma; Workers AI asi 0,01 USD za 1000 requestu.

Ktery plan? Pro a Platinum zahrnuji hlasove objednavky.

V hluku? Nad 65 dB pada presnost, tap je vsak vzdy k dispozici.

Bylo to užitečné? Sdílejte to.