Un caffe sulla spiaggia di Akcaabat: il cliente regge un cono gelato con due mani e non puo toccare il telefono. Dice "ordinami un ayran e un pane" e il browser fa il resto — niente app da installare, solo QR e permesso microfono.
ASR direttamente nel browser
Chrome e Safari includono SpeechRecognition con lang="it-IT" o "tr-TR". Il testo grezzo torna in circa 1,2 secondi senza modelli da scaricare.
Il testo viene inviato a LLaMA 3.1 8B su Cloudflare Workers AI con uno schema JSON rigido. La cache KV porta le frasi ricorrenti sotto i 50 ms.
Ambiguita risolte
"Ayran" bevanda contro "ayran corbasi" zuppa: l'assistente chiede una volta e mostra due card. Una parola o un tap chiude il dubbio.
- Accenti regionali tollerati con soglia fuzzy 0,85
- Allergeni: "senza arachidi" diventa slot negativo
- Quantita: "mezza porzione" diventa 0,5 nel carrello
Accessibilita e fallback
Chi ha bassa vista guadagna molto: aria-live="polite" e TTS leggono il carrello. Senza WebSpeechAPI il menu torna al tap classico, tutto continua a funzionare.
La voce e un plus, non una dipendenza fragile — anche su tablet Android datati.
FAQ
Quanto costa? WebSpeechAPI gratuito; Workers AI circa 0,01 USD ogni 1000 richieste.
Quale piano? Pro e Platinum includono gli ordini vocali.
In ambiente rumoroso? Oltre 65 dB la precisione cala, ma il tap resta sempre disponibile.
Ti è stato utile? Condividilo.
Articoli correlati
QR statico vs QR dinamico: costo totale a 3 anni a confronto
Un bistrot da 24 tavoli mette in fila i numeri: 21.000 TRY di ristampe vs 11.640…
Omotenashi e QR: ospitalità giapponese senza perdere il tocco umano
Perché il Sukiyabashi Jiro di Tokyo rifiuta i menu QR mentre il 68% delle izakay…
Anteprima AR dei piatti via WebXR: 3D nel browser senza app
Come Dishoom Soho ha ottenuto +22% sullo scontrino medio con model-viewer. Ottim…