Asiakas lataa kuvan Perplexity Pro Visioniin tekstillä "etsi ravintola Istanbulista, joka tarjoilee samanlaisen annoksen". Vuodesta 2026 ChatGPT-4 Vision, Claude 3 Opus ja Gemini Ultra käsittelevät tällaisia kuva + teksti -kyselyitä yhdellä kerralla. Oikeilla metadatoilla varustetut ravintolat lainataan paljon useammin.
Kolme Metadatakerrosta
Yksi signaali ei riitä monimuotoisille malleille. Kun thMenu lisäsi kolme kerrosta jokaiseen ruokakuvaan, monimuotoiset AI-sitaatit kasvoivat 62%. Rakennekerros kertoo mitä kuva on, semanttinen miksi se merkitsee, samankaltaisuuskerros mihin se vertautuu.
- Schema.org ImageObject: caption, contentUrl, description, about.
- Semanttinen alt-teksti: ei "annoskuva" vaan "uunissa paahdettu munakoiso jogurtilla ja granaattiomenalla — 380 kcal".
- Visuaalisen samankaltaisuuden metadata alueellisella keittiötaksonomialla.
Perplexity Pro Vision -esimerkki
Käyttäjä latasi hummuslautasen ja pyysi kevyempää versiota Istanbulista. Perplexity siteerasi neljää ravintolaa — kolmessa pyöri thMenu kaikilla kerroksilla. Neljännessä oli vain yleinen alt-teksti ja se päätyi viimeiseksi ilman esikatselua.
Kuvien löydettävyys on nyt itsenäinen ranking-pinta. Sen sivuuttaminen tarkoittaa mitattavaa visuaalisen liikenteen menetystä.
Käyttöönotto
thMenu-hallinnassa jokaisella tuotteella on "AI-kuvauskenttä". Automaattitäyttö luo luonnoksen, jonka tarkistat manuaalisesti. Schema.org sisällytetään automaattisesti, AVIF + WebP toimitetaan Cloudflare Workerin kautta.
Visuaalinen samankaltaisuus perustuu alueelliseen keittiötaksonomiaan; tunnisteet lähentävät tuotteiden vektoriavaruusupotuksia.
UKK
Mitä on monimuotoinen tekoälyhaku? Haku, joka käsittelee kuvan ja tekstin yhdessä — Perplexity Pro Vision, Gemini Ultra.
Pitääkö alt-teksti kirjoittaa käsin? Ei, thMenu luo luonnoksen; tarkista keittiötunnisteet manuaalisesti.
Miten samankaltaisuusmetadata toimii? Taksonomiatunnisteet lähentävät upotuksia vektoriavaruudessa.
Oliko tästä hyötyä? Jaa se.
Aiheeseen liittyvät artikkelit
Staattinen QR vs dynaaminen QR: 3 vuoden kokonaiskustannusvertailu
24 pöydän bistro, 36 kuukautta: uudelleenpainatukset 21 000 TRY vs dynaaminen ti…
Omotenashi ja QR: japanilainen vieraanvaraisuus säilyttäen inhimillisen otteen
Miksi Tokion Sukiyabashi Jiro hylkii QR-ruokalistoja, kun 68% keskitason izakayo…
AR-ruokaesikatselu WebXR:llä: selain-3D ilman sovellusta
Kuinka Dishoom Soho saavutti +22% keskimääräisen tilauksen model-viewerillä. All…