Гость загружает фото в Perplexity Pro Vision с подписью "найди ресторан в Стамбуле с похожим блюдом". С 2026 года ChatGPT-4 Vision, Claude 3 Opus и Gemini Ultra обрабатывают такие запросы изображение + текст за один проход. Рестораны с правильными метаданными цитируются гораздо чаще.
Три Слоя Метаданных
Одного сигнала мультимодальным моделям мало. Когда thMenu добавил три слоя к каждому изображению меню, мультимодальные AI-цитирования выросли на 62%. Структурный слой объясняет, что это, семантический — почему это важно, слой сходства — на что это похоже.
- Schema.org ImageObject с caption, contentUrl, description, about.
- Семантический alt-text: не "фото блюда", а "запечённый баклажан с йогуртом и гранатом — 380 ккал".
- Метаданные визуального сходства с региональной кулинарной таксономией.
Пример Perplexity Pro Vision
Пользователь загрузил тарелку хумуса и попросил более лёгкую версию в Стамбуле. Perplexity процитировал четыре ресторана — три использовали thMenu со всеми тремя слоями. У четвёртого был только общий alt-text, и он замкнул выдачу без визуального превью.
Обнаруживаемость изображений теперь — самостоятельная ранжирующая поверхность. Игнорировать её — терять измеримый визуальный трафик.
Внедрение
В админке thMenu у каждого продукта есть поле "AI-описание изображения". Автозаполнение даёт черновик, вы проверяете вручную. Schema.org встраивается автоматически, AVIF + WebP отдаются через Cloudflare Worker.
Визуальное сходство строится на региональной кулинарной таксономии. Теги сближают эмбеддинги в векторном пространстве.
FAQ
Что такое мультимодальный AI-поиск? Поиск, обрабатывающий изображение и текст вместе — Perplexity Pro Vision, Gemini Ultra.
Нужно писать alt-text вручную? Нет, thMenu генерирует черновик; теги кухни проверяйте вручную.
Как работают метаданные сходства? Теги таксономии сближают эмбеддинги в векторном пространстве.
Было полезно? Поделитесь.
Похожие статьи
Статический QR vs динамический QR: сравнение TCO за 3 года
Бистро на 24 столика: 21 000 TRY на перепечатки против 11 640 TRY за динамическу…
Омотэнаси и QR: японское гостеприимство без потери человечности
Почему Sukiyabashi Jiro в Токио отказывается от QR-меню, а 68% средних идзакай п…
AR-предпросмотр блюд через WebXR: 3D в браузере без приложения
Как Dishoom Soho достиг +22% к среднему чеку благодаря model-viewer. Оптимизация…