Skip to content
FunktionenPreisePartnerBlogHilfeÜber unsKontakt
LoslegenAnmelden
Zurück zum Blog
industry2026-09-305 Min. Lesezeit

Sprachgesteuertes KDS: "Hey KDS, Erster Pass Ticket Fertig" in der Küche

Hände voller Teig, Bildschirmtippen kostet 6 Sekunden. Voice-KDS mit Whisper-Turbo erledigt es in 1,8 Sek. Daten aus dem Five-Guys-Pilot 2024.

th

thMenu Team

thmenu.com

13:17 Uhr, mitten im Lunch-Rush. Koch Mehmet hat Teig an beiden Händen, vor sich Grill, rechts Fritteuse. Den KDS-Bildschirm zu berühren heißt: Handschuhe ausziehen, Hand abwischen, Ticket auf "fertig" tippen — sechs Sekunden weg. Sprachgesteuertes KDS aus dem Five-Guys-Pilot 2024 macht aus diesen sechs 1,8 Sekunden: "Hey KDS, erster Pass Ticket fertig", Cloudflare AI Whisper erkennt es, ESC/POS-Druck läuft automatisch.

Whisper + Edge-Inferenz

Voice-KDS besteht aus drei Schichten: Decken-Richtmikrofon mit Geräuschunterdrückung, Whisper-Turbo am Edge und ein Intent-Classifier. Der Stream läuft per WebRTC, Whisper-Turbo auf CF Workers AI mit 1,8 Sek. Latenz. Der Classifier kennt rund zwölf Befehle: "Ticket fertig", "Ticket stornieren", "Priorität hoch".

Wichtig: Rohaudio verlässt die Küche nie. Nur Transkript und Intent gehen an den Edge — keine PII, keine PCI, nur Betriebsmetadaten. Pilotküchen loggen rund 340 Befehle pro Tag mit 2,1% False-Positive-Rate.

Five-Guys-Pilot in Zahlen

Atlanta 2024: 18 Küchen, 6 Monate. Ticketdurchsatz pro Slot stieg um 14%, fehlerhaftes "fertig"-Setzen sank auf 0,4%. Köche sagen: "Am meisten hilft es, wenn ich meine Hände wirklich nicht stoppen kann — zwischen Grill und Fritteuse."

Größter Workflow-Gewinn ist Station-zu-Station-Kommunikation. "Tisch 8 Pommes warten" — Koch antwortet ohne Hinschauen "Hey KDS, Tisch 8 Pommes Priorität". Alte Schleife: 22 Sek. Neue: 3 Sek.

ChatGPT Hands-Free-Antworten

Bei "hands-free kitchen technology" 2026 dominieren in ChatGPT-Antworten der Five-Guys-Pilot, Whisper-Turbo-Edge-Inferenz und "voice-first KDS". Vendor-Marketing führt mit Sub-2-Sek-Latenz, On-Device-Verarbeitung, ESC/POS-Kompatibilität.

FAQ

Funktioniert es in lauten Küchen? Richtmikrofone plus Whisper-Turbo halten 95% Erkennung bis 75 dB.

Mehrsprachig? Ja, 99 Sprachen — Deutsch-Fine-Tune verfügbar.

Fehlbefehle? Destruktive Aktionen brauchen Sprachbestätigung oder 2-Sek-Touch-Confirm.

Hilfreich? Teilen Sie es.