Skip to content
FunkcjeCennikPartnerzyBlogPomocO nasKontakt
Zacznij terazZaloguj się
Powrót do Bloga
industry2026-08-266 min czytania

Zamawianie glosem w przegladarce przez WebSpeechAPI w kawiarniach

Kawiarnia nad morzem: klient z lodami w rece zamawia glosem z przegladarki. Techniczny przewodnik WebSpeechAPI plus Cloudflare AI NLU.

th

thMenu Team

thmenu.com

Plazowa kawiarnia w Akcaabacie: klient trzyma rozek lodow dwoma rekami i nie moze dotknac telefonu. Mowi "zamow ayran i chleb" — przegladarka robi reszte. Bez aplikacji, tylko QR i pozwolenie na mikrofon.

ASR w przegladarce

Chrome i Safari maja SpeechRecognition z lang="pl-PL" lub "tr-TR". Surowy tekst wraca w okolo 1,2 sekundy bez pobierania modeli.

Tekst trafia do LLaMA 3.1 8B na Cloudflare Workers AI z surowym schematem JSON. KV cache obniza powtarzajace sie frazy do 50 ms.

Rozwiazywanie niejednoznacznosci

"Ayran" napoj vs "ayran corbasi" zupa: NLU pyta raz i pokazuje dwie karty. Jedno slowo lub tapniecie konczy temat.

  • Akcenty regionalne z progiem fuzzy 0,85
  • Alergeny: "bez orzeszkow" jako slot negatywny
  • Ilosci: "pol porcji" trafia jako 0,5 do koszyka

Dostepnosc i fallback

Slabowidzacy zyskuja: aria-live="polite" i TTS odczytuja koszyk. Bez WebSpeechAPI menu wraca do trybu dotykowego.

Glos to dodatek, nie krytyczna zaleznosc.

FAQ

Ile kosztuje? WebSpeechAPI darmowe; Workers AI okolo 0,01 USD za 1000 zapytan.

Ktory plan? Pro i Platinum zawieraja zamawianie glosem.

W halasie? Powyzej 65 dB precyzja spada, ale tap zawsze dziala.

Czy to było pomocne? Udostępnij.