Framtiden för röstbeställning i restauranger har mognat snabbt de senaste 18 månaderna. Från Alexa Show-bordsskärmar till integrerade Whisper-lösningar — gäster kan beställa utan att läsa menyn. Vi tittar på nuläget, tillgänglighetsvinster och kvarvarande tekniska hinder.
Nuläge
Tre vägar: enhet (Alexa, Google Home), webb (mikrofonknapp i menyn), telefon-IVR.
thMenu och andra fångar ljud via Web Speech API, skickar till Whisper, uppdaterar varukorgen. Latens 1,5-2,5 s.
Verklig tillgänglighetsvinst
För synskadade gäster det första riktiga pappersalternativet. Mer flytande än skärmläsare. Äldre gynnas också: "Vad har ni idag?" är mer intuitivt än att tampas med textstorlek.
Igenkänningsutmaningar
Regionala namn svåra. "Köttbullar" i en engelsk modell misslyckas. Lösning: rätt språkmodell + anpassad vokabulär.
Buller: livlig bar, SNR 5-10 dB, precision 85%.
Integritet
Ljud är känsligt. Inspelning endast efter knapptryck; rått ljud raderas inom 30 minuter. GDPR kräver tydlig information.
Om fem år
On-device AI sänker latensen under 300 ms. Röstbeställning kan bli standard. Piloter på thMenu rapporterar positivt, fel -30%.
Börja med tillgänglighet — den säkraste investeringen.
Var detta hjälpsamt? Dela det.
Relaterade artiklar
Statisk QR vs dynamisk QR: total ägandekostnad över 3 år
24-bords bistro, 36 månader: 21 000 TRY i omtryck vs 11 640 TRY dynamisk prenume…
Omotenashi möter QR: japansk gästfrihet utan att förlora den mänskliga touchen
Varför Tokyos Sukiyabashi Jiro avvisar QR-menyer medan 68% av mellanklassens iza…
AR-matförhandsvisning via WebXR: webbläsar-3D utan app
Hur Dishoom Soho uppnådde +22% genomsnittsnota med model-viewer. Under-200KB .gl…