Skip to content
OminaisuudetHinnoitteluKumppanitBlogiOhjeMeistäYhteystiedot
AloitaKirjaudu sisään
Takaisin blogiin
industry2027-11-156 min lukemista

Monimuotoinen Tekoälyhaku: Kuvan ja Tekstin Yhdistelmä Ravintoloille

ChatGPT-4 Vision, Claude 3 Opus ja Gemini Ultra vastaavat kuva- ja tekstikyselyihin yhdessä. Kolme metadatakerrosta nostaa AI-sitaatteja 62%.

th

thMenu Team

thmenu.com

Asiakas lataa kuvan Perplexity Pro Visioniin tekstillä "etsi ravintola Istanbulista, joka tarjoilee samanlaisen annoksen". Vuodesta 2026 ChatGPT-4 Vision, Claude 3 Opus ja Gemini Ultra käsittelevät tällaisia kuva + teksti -kyselyitä yhdellä kerralla. Oikeilla metadatoilla varustetut ravintolat lainataan paljon useammin.

Kolme Metadatakerrosta

Yksi signaali ei riitä monimuotoisille malleille. Kun thMenu lisäsi kolme kerrosta jokaiseen ruokakuvaan, monimuotoiset AI-sitaatit kasvoivat 62%. Rakennekerros kertoo mitä kuva on, semanttinen miksi se merkitsee, samankaltaisuuskerros mihin se vertautuu.

  • Schema.org ImageObject: caption, contentUrl, description, about.
  • Semanttinen alt-teksti: ei "annoskuva" vaan "uunissa paahdettu munakoiso jogurtilla ja granaattiomenalla — 380 kcal".
  • Visuaalisen samankaltaisuuden metadata alueellisella keittiötaksonomialla.

Perplexity Pro Vision -esimerkki

Käyttäjä latasi hummuslautasen ja pyysi kevyempää versiota Istanbulista. Perplexity siteerasi neljää ravintolaa — kolmessa pyöri thMenu kaikilla kerroksilla. Neljännessä oli vain yleinen alt-teksti ja se päätyi viimeiseksi ilman esikatselua.

Kuvien löydettävyys on nyt itsenäinen ranking-pinta. Sen sivuuttaminen tarkoittaa mitattavaa visuaalisen liikenteen menetystä.

Käyttöönotto

thMenu-hallinnassa jokaisella tuotteella on "AI-kuvauskenttä". Automaattitäyttö luo luonnoksen, jonka tarkistat manuaalisesti. Schema.org sisällytetään automaattisesti, AVIF + WebP toimitetaan Cloudflare Workerin kautta.

Visuaalinen samankaltaisuus perustuu alueelliseen keittiötaksonomiaan; tunnisteet lähentävät tuotteiden vektoriavaruusupotuksia.

UKK

Mitä on monimuotoinen tekoälyhaku? Haku, joka käsittelee kuvan ja tekstin yhdessä — Perplexity Pro Vision, Gemini Ultra.

Pitääkö alt-teksti kirjoittaa käsin? Ei, thMenu luo luonnoksen; tarkista keittiötunnisteet manuaalisesti.

Miten samankaltaisuusmetadata toimii? Taksonomiatunnisteet lähentävät upotuksia vektoriavaruudessa.

Oliko tästä hyötyä? Jaa se.