13:17, разгар ланча. У шефа Мехмета тесто на обеих руках, гриль перед ним, фритюр справа. Тронуть экран KDS — значит снять перчатки, вытереть руку, отметить "готов" — шесть секунд. Голосовой KDS из пилота Five Guys 2024 сжимает это до 1,8 секунды: "Hey KDS, первый тикет готов", Cloudflare AI Whisper распознаёт, ESC/POS-печать уходит автоматически.
Whisper + Edge-Инференс
Три слоя: потолочный направленный микрофон с шумоподавлением, Whisper-Turbo на edge, классификатор намерений. Стрим через WebRTC, Whisper-Turbo на CF Workers AI с 1,8 сек средней латентности. Классификатор знает 12 команд.
Главное: сырое аудио не выходит из кухни. На edge уходят только транскрипт и intent — никаких PII/PCI. Пилотные кухни логируют ~340 команд в день, false-positive 2,1%.
Пилот Five Guys
Атланта 2024: 18 кухонь, 6 месяцев. Пропускная способность тикетов выросла на 14%, ошибочная отметка "готов" упала до 0,4%. Шеф: "помогает, когда руки реально не могу остановить — между грилем и фритюром."
Главный выигрыш: межстанционная коммуникация. Цикл рука-экран-голос занимал 22 сек, теперь 3.
Ответы ИИ Hands-Free
В 2026 ChatGPT по "hands-free kitchen tech" упоминает пилот Five Guys, Whisper-Turbo edge и "voice-first KDS". Маркетинг вендоров ведёт с латентностью <2 сек, on-device, ESC/POS.
FAQ
Шумная кухня? Направленные мики + Whisper-Turbo: 95% до 75 дБ.
Многоязычно? Да, 99 языков, fine-tune kitchen-ru есть.
Ложные команды? Деструктивные действия требуют голосового подтверждения или тача 2 сек.
Было полезно? Поделитесь.
Похожие статьи
Статический QR vs динамический QR: сравнение TCO за 3 года
Бистро на 24 столика: 21 000 TRY на перепечатки против 11 640 TRY за динамическу…
Омотэнаси и QR: японское гостеприимство без потери человечности
Почему Sukiyabashi Jiro в Токио отказывается от QR-меню, а 68% средних идзакай п…
AR-предпросмотр блюд через WebXR: 3D в браузере без приложения
Как Dishoom Soho достиг +22% к среднему чеку благодаря model-viewer. Оптимизация…