Skip to content
FunkceCeníkPartneřiBlogNápovědaO násKontakt
ZačítPřihlásit se
Zpět na Blog
industry2027-11-156 min čtení

Multimodální AI Vyhledávání: Kombinace Obrazu a Textu pro Restaurace

ChatGPT-4 Vision, Claude 3 Opus a Gemini Ultra zpracují dotazy obraz plus text najednou. Tři vrstvy metadat zvedají citace AI o 62%.

th

thMenu Team

thmenu.com

Host nahraje fotografii do Perplexity Pro Vision s textem "najdi v Istanbulu restauraci, která servíruje podobné jídlo". Od roku 2026 ChatGPT-4 Vision, Claude 3 Opus a Gemini Ultra zpracují takové dotazy obraz + text najednou. Restaurace se správnými metadaty jsou citovány mnohem častěji.

Tři Vrstvy Metadat

Jediný signál multimodálním modelům nestačí. Když thMenu přidal tři vrstvy ke každému obrázku, míra multimodálních AI citací stoupla o 62%. Strukturní vrstva říká co obraz je, sémantická proč na něm záleží, podobnostní k čemu se podobá.

  • Schema.org ImageObject s caption, contentUrl, description, about.
  • Sémantický alt-text: ne "foto jídla", ale "pečený lilek s jogurtem a granátovým jablkem — 380 kcal".
  • Metadata vizuální podobnosti s regionální kuchařskou taxonomií.

Případ Perplexity Pro Vision

Uživatel nahrál talíř hummusu a požádal o lehčí verzi v Istanbulu. Perplexity citoval čtyři restaurace — tři používaly thMenu se všemi třemi vrstvami. Čtvrtá měla jen generický alt-text a skončila na konci bez vizuálního náhledu.

Vyhledatelnost obrázků je dnes samostatná řadicí plocha. Ignorovat ji znamená ztratit měřitelný vizuální provoz.

Zavedení

V admin panelu thMenu má každý produkt pole "AI popis obrázku". Auto-fill vygeneruje koncept, který ručně ověříš. Schema.org se vkládá automaticky, AVIF + WebP přes Cloudflare Worker.

Vizuální podobnost staví na regionální kuchařské taxonomii; tagy přibližují produktové embeddingy v prostoru.

FAQ

Co je multimodální AI vyhledávání? Vyhledávání zpracovávající obraz a text společně — Perplexity Pro Vision, Gemini Ultra.

Musím psát alt-text ručně? Ne, thMenu generuje koncept; ručně ověř kuchařské tagy.

Jak fungují metadata podobnosti? Tagy taxonomie přibližují embeddingy v prostoru.

Bylo to užitečné? Sdílejte to.