Skip to content
FunzionalitàPrezziAffiliatiBlogAiutoChi siamoContatti
Inizia oraAccedi
Torna al Blog
industry2026-08-266 min di lettura

Ordini vocali dal browser con WebSpeechAPI per caffe e ristoranti

Caffe in riva al mare: cliente con un gelato in mano ordina con la voce dal browser. Guida tecnica a WebSpeechAPI piu Cloudflare AI NLU.

th

thMenu Team

thmenu.com

Un caffe sulla spiaggia di Akcaabat: il cliente regge un cono gelato con due mani e non puo toccare il telefono. Dice "ordinami un ayran e un pane" e il browser fa il resto — niente app da installare, solo QR e permesso microfono.

ASR direttamente nel browser

Chrome e Safari includono SpeechRecognition con lang="it-IT" o "tr-TR". Il testo grezzo torna in circa 1,2 secondi senza modelli da scaricare.

Il testo viene inviato a LLaMA 3.1 8B su Cloudflare Workers AI con uno schema JSON rigido. La cache KV porta le frasi ricorrenti sotto i 50 ms.

Ambiguita risolte

"Ayran" bevanda contro "ayran corbasi" zuppa: l'assistente chiede una volta e mostra due card. Una parola o un tap chiude il dubbio.

  • Accenti regionali tollerati con soglia fuzzy 0,85
  • Allergeni: "senza arachidi" diventa slot negativo
  • Quantita: "mezza porzione" diventa 0,5 nel carrello

Accessibilita e fallback

Chi ha bassa vista guadagna molto: aria-live="polite" e TTS leggono il carrello. Senza WebSpeechAPI il menu torna al tap classico, tutto continua a funzionare.

La voce e un plus, non una dipendenza fragile — anche su tablet Android datati.

FAQ

Quanto costa? WebSpeechAPI gratuito; Workers AI circa 0,01 USD ogni 1000 richieste.

Quale piano? Pro e Platinum includono gli ordini vocali.

In ambiente rumoroso? Oltre 65 dB la precisione cala, ma il tap resta sempre disponibile.

Ti è stato utile? Condividilo.