En strandkafe i Akcaabat: gjesten holder en iskremkjeks med begge hender og kan ikke ta paa telefonen. Han sier "bestill en ayran og et brod" og nettleseren ordner resten — ingen app, bare QR og mikrofontilgang.
Nettleser-ASR
Chrome og Safari leverer SpeechRecognition med lang="nb-NO" eller "tr-TR". Rateksten kommer paa ca. 1,2 sekunder uten nedlasting.
Teksten gaar til LLaMA 3.1 8B paa Cloudflare Workers AI med strengt JSON-skjema. KV cache senker gjentatte fraser under 50 ms.
Tvetydigheter
"Ayran" drikk vs "ayran corbasi" suppe: NLU spor en gang og viser to kort. Ett ord eller tapp avslutter.
- Dialekter med fuzzy terskel 0,85
- Allergener: "uten peanotter" som negativ slot
- Antall: "halv porsjon" blir 0,5
Tilgjengelighet og fallback
Svaksynte gjester vinner mest: aria-live="polite" og TTS leser handlekurven. Uten WebSpeechAPI gaar menyen stille tilbake til tapp-modus.
Stemme er en bonus, ikke en kritisk avhengighet.
FAQ
Koster det? WebSpeechAPI er gratis; Workers AI ca 0,01 USD per 1000 forespoersler.
Hvilken plan? Pro og Platinum inkluderer stemmebestilling.
I stoyende miljoer? Over 65 dB synker presisjonen, men tapp er alltid mulig.
Var dette nyttig? Del det.
Relaterte artikler
Statisk QR vs dynamisk QR: total eierkostnad over 3 år
24-bord bistro, 36 måneder: 21 000 TRY i opptrykk vs 11 640 TRY dynamisk abonnem…
Omotenashi møter QR: japansk gjestfrihet uten å miste den menneskelige berøringen
Hvorfor Tokyos Sukiyabashi Jiro avviser QR-menyer mens 68% av mellomklasse-izaka…
AR matforhåndsvisning via WebXR: nettleser-3D uten app
Hvordan Dishoom Soho oppnådde +22% gjennomsnittlig regning med model-viewer. Sub…