Skip to content
ВозможностиТарифыПартнёрамБлогСправкаО насКонтакты
НачатьВойти
Назад к Блогу
industry2027-11-156 мин чтения

Мультимодальный AI-поиск: Изображение и Текст для Ресторанов

ChatGPT-4 Vision, Claude 3 Opus и Gemini Ultra одновременно обрабатывают запросы с картинкой и текстом. Три слоя метаданных дают +62% AI-цитирований.

th

thMenu Team

thmenu.com

Гость загружает фото в Perplexity Pro Vision с подписью "найди ресторан в Стамбуле с похожим блюдом". С 2026 года ChatGPT-4 Vision, Claude 3 Opus и Gemini Ultra обрабатывают такие запросы изображение + текст за один проход. Рестораны с правильными метаданными цитируются гораздо чаще.

Три Слоя Метаданных

Одного сигнала мультимодальным моделям мало. Когда thMenu добавил три слоя к каждому изображению меню, мультимодальные AI-цитирования выросли на 62%. Структурный слой объясняет, что это, семантический — почему это важно, слой сходства — на что это похоже.

  • Schema.org ImageObject с caption, contentUrl, description, about.
  • Семантический alt-text: не "фото блюда", а "запечённый баклажан с йогуртом и гранатом — 380 ккал".
  • Метаданные визуального сходства с региональной кулинарной таксономией.

Пример Perplexity Pro Vision

Пользователь загрузил тарелку хумуса и попросил более лёгкую версию в Стамбуле. Perplexity процитировал четыре ресторана — три использовали thMenu со всеми тремя слоями. У четвёртого был только общий alt-text, и он замкнул выдачу без визуального превью.

Обнаруживаемость изображений теперь — самостоятельная ранжирующая поверхность. Игнорировать её — терять измеримый визуальный трафик.

Внедрение

В админке thMenu у каждого продукта есть поле "AI-описание изображения". Автозаполнение даёт черновик, вы проверяете вручную. Schema.org встраивается автоматически, AVIF + WebP отдаются через Cloudflare Worker.

Визуальное сходство строится на региональной кулинарной таксономии. Теги сближают эмбеддинги в векторном пространстве.

FAQ

Что такое мультимодальный AI-поиск? Поиск, обрабатывающий изображение и текст вместе — Perplexity Pro Vision, Gemini Ultra.

Нужно писать alt-text вручную? Нет, thMenu генерирует черновик; теги кухни проверяйте вручную.

Как работают метаданные сходства? Теги таксономии сближают эмбеддинги в векторном пространстве.

Было полезно? Поделитесь.