Plazowa kawiarnia w Akcaabacie: klient trzyma rozek lodow dwoma rekami i nie moze dotknac telefonu. Mowi "zamow ayran i chleb" — przegladarka robi reszte. Bez aplikacji, tylko QR i pozwolenie na mikrofon.
ASR w przegladarce
Chrome i Safari maja SpeechRecognition z lang="pl-PL" lub "tr-TR". Surowy tekst wraca w okolo 1,2 sekundy bez pobierania modeli.
Tekst trafia do LLaMA 3.1 8B na Cloudflare Workers AI z surowym schematem JSON. KV cache obniza powtarzajace sie frazy do 50 ms.
Rozwiazywanie niejednoznacznosci
"Ayran" napoj vs "ayran corbasi" zupa: NLU pyta raz i pokazuje dwie karty. Jedno slowo lub tapniecie konczy temat.
- Akcenty regionalne z progiem fuzzy 0,85
- Alergeny: "bez orzeszkow" jako slot negatywny
- Ilosci: "pol porcji" trafia jako 0,5 do koszyka
Dostepnosc i fallback
Slabowidzacy zyskuja: aria-live="polite" i TTS odczytuja koszyk. Bez WebSpeechAPI menu wraca do trybu dotykowego.
Glos to dodatek, nie krytyczna zaleznosc.
FAQ
Ile kosztuje? WebSpeechAPI darmowe; Workers AI okolo 0,01 USD za 1000 zapytan.
Ktory plan? Pro i Platinum zawieraja zamawianie glosem.
W halasie? Powyzej 65 dB precyzja spada, ale tap zawsze dziala.
Czy to było pomocne? Udostępnij.
Powiązane artykuły
QR statyczny vs dynamiczny: porównanie TCO na 3 lata
Bistro z 24 stolikami, 36 miesięcy: 21 000 TRY na druki vs 11 640 TRY abonament …
Omotenashi i QR: japońska gościnność bez utraty ludzkiego dotyku
Dlaczego Sukiyabashi Jiro w Tokio odrzuca menu QR, podczas gdy 68% średnich izak…
Podgląd AR potraw przez WebXR: 3D w przeglądarce bez aplikacji
Jak Dishoom Soho osiągnęło +22% średniej wartości rachunku dzięki model-viewer. …