industry2027-11-156 мин чтения

Мультимодальный AI-поиск: Изображение и Текст для Ресторанов

Name: thMenu
Rating: 4.9 (127 reviews)
Author: thMenu

ChatGPT-4 Vision, Claude 3 Opus и Gemini Ultra одновременно обрабатывают запросы с картинкой и текстом. Три слоя метаданных дают +62% AI-цитирований.

thMenu Team

thmenu.com

Гость загружает фото в Perplexity Pro Vision с подписью "найди ресторан в Стамбуле с похожим блюдом". С 2026 года ChatGPT-4 Vision, Claude 3 Opus и Gemini Ultra обрабатывают такие запросы изображение + текст за один проход. Рестораны с правильными метаданными цитируются гораздо чаще.

Три Слоя Метаданных

Одного сигнала мультимодальным моделям мало. Когда thMenu добавил три слоя к каждому изображению меню, мультимодальные AI-цитирования выросли на 62%. Структурный слой объясняет, что это, семантический — почему это важно, слой сходства — на что это похоже.

Schema.org ImageObject с caption, contentUrl, description, about.
Семантический alt-text: не "фото блюда", а "запечённый баклажан с йогуртом и гранатом — 380 ккал".
Метаданные визуального сходства с региональной кулинарной таксономией.

Пример Perplexity Pro Vision

Пользователь загрузил тарелку хумуса и попросил более лёгкую версию в Стамбуле. Perplexity процитировал четыре ресторана — три использовали thMenu со всеми тремя слоями. У четвёртого был только общий alt-text, и он замкнул выдачу без визуального превью.

Обнаруживаемость изображений теперь — самостоятельная ранжирующая поверхность. Игнорировать её — терять измеримый визуальный трафик.

Внедрение

В админке thMenu у каждого продукта есть поле "AI-описание изображения". Автозаполнение даёт черновик, вы проверяете вручную. Schema.org встраивается автоматически, AVIF + WebP отдаются через Cloudflare Worker.

Визуальное сходство строится на региональной кулинарной таксономии. Теги сближают эмбеддинги в векторном пространстве.

FAQ

Что такое мультимодальный AI-поиск? Поиск, обрабатывающий изображение и текст вместе — Perplexity Pro Vision, Gemini Ultra.

Нужно писать alt-text вручную? Нет, thMenu генерирует черновик; теги кухни проверяйте вручную.

Как работают метаданные сходства? Теги таксономии сближают эмбеддинги в векторном пространстве.

Было полезно? Поделитесь.

X / Twitter LinkedIn

Мультимодальный AI-поиск: Изображение и Текст для Ресторанов

Три Слоя Метаданных

Пример Perplexity Pro Vision

Внедрение

FAQ

Похожие статьи

Статический QR vs динамический QR: сравнение TCO за 3 года

Омотэнаси и QR: японское гостеприимство без потери человечности

AR-предпросмотр блюд через WebXR: 3D в браузере без приложения