Skip to content
FonctionnalitésTarifsAffiliésBlogAideÀ proposContact
CommencerSe connecter
Retour au Blog
industry2026-08-266 min de lecture

Commande vocale dans le navigateur via WebSpeechAPI pour cafes

Cafe en bord de plage: client avec une glace en main passe sa commande a la voix depuis le navigateur. Guide WebSpeechAPI plus Cloudflare AI NLU.

th

thMenu Team

thmenu.com

Cafe de la plage d'Akcaabat: le client tient un cornet de glace a deux mains et ne peut pas toucher son ecran. Il dit "commande-moi un ayran et un pain" et le navigateur fait le reste — pas d'app a installer, juste un QR code et l'autorisation micro.

Reconnaissance vocale dans le navigateur

Chrome et Safari fournissent SpeechRecognition en natif avec lang="fr-FR" ou "tr-TR". Le texte brut revient en environ 1,2 seconde sans modele a telecharger. Une animation d'onde rassure pendant l'ecoute.

Le texte part vers LLaMA 3.1 8B sur Cloudflare Workers AI avec un schema JSON strict. Le cache KV ramene les phrases recurrentes a moins de 50 ms.

Resoudre les ambiguites

"Ayran" la boisson contre "ayran corbasi" la soupe: le NLU pose une seule question de levee de doute et affiche deux cartes. Un mot ou un tap termine la commande.

  • Accents regionaux toleres avec un seuil fuzzy de 0,85
  • Allergenes: "sans arachides" detecte comme slot negatif
  • Quantites: "demi portion" devient 0,5 dans le panier

Accessibilite et repli

Les clients malvoyants gagnent enormement: la zone aria-live="polite" est lue par TTS. Si le navigateur ne supporte pas WebSpeechAPI, le menu retombe en mode tactile classique sans rien casser.

La voix est un bonus et non une dependance fragile — toutes les autres fonctionnalites restent intactes.

FAQ

Combien ca coute? WebSpeechAPI est gratuit; Workers AI environ 0,01 USD pour 1000 requetes.

Quel plan? Pro et Platinum incluent la commande vocale.

En milieu bruyant? Au-dela de 65 dB la precision baisse, le tap reste toujours disponible.

Cet article vous a été utile ? Partagez-le.