En strandcafe i Akcaabat: gasten holder en ishorn med begge haender og kan ikke roere telefonen. Han siger "bestil en ayran og et brod" og browseren goer resten — ingen app, kun QR og mikrofonadgang.
Browser-ASR
Chrome og Safari leverer SpeechRecognition med lang="da-DK" eller "tr-TR". Den ra tekst kommer paa ca. 1,2 sekunder uden download.
Teksten gaar til LLaMA 3.1 8B paa Cloudflare Workers AI med stramt JSON-skema. KV cache trykker gentagne saetninger under 50 ms.
Tvetydigheder
"Ayran" drik versus "ayran corbasi" suppe: NLU spoerger en gang og viser to kort. Et ord eller tryk afslutter.
- Dialekter med fuzzy taerskel 0,85
- Allergener: "uden peanuts" forstaaet som negativ slot
- Antal: "halv portion" bliver 0,5
Tilgaengelighed og fallback
Synshandicappede gaester vinder mest: aria-live="polite" og TTS laeser kurven. Uden WebSpeechAPI gaar menuen stille tilbage til tap.
Stemmen er en ekstra, ikke en kritisk afhaengighed.
FAQ
Pris? WebSpeechAPI gratis; Workers AI ca 0,01 USD pr. 1000 requests.
Hvilken plan? Pro og Platinum omfatter stemmebestilling.
I stoejende miljoeer? Over 65 dB falder praecisionen men tap er altid muligt.
Var dette nyttigt? Del det.
Relaterede artikler
Statisk QR vs dynamisk QR: samlede ejeromkostninger over 3 år
Bistro med 24 borde, 36 måneder: 21.000 TRY i genoptryk vs 11.640 TRY dynamisk a…
Omotenashi møder QR: japansk gæstfrihed uden at miste den menneskelige touch
Hvorfor Tokyos Sukiyabashi Jiro afviser QR-menuer, mens 68% af mellemklasse-izak…
AR-madforhåndsvisning via WebXR: browser-3D uden app
Hvordan Dishoom Soho opnåede +22% gennemsnitsregning med model-viewer. Sub-200KB…