İçeriğe atla
ÖzelliklerFiyatlandırmaİş OrtaklığıBlogYardımHakkımızdaİletişim
BaşlaGiriş Yap
Bloga Dön
tips2026-07-236 dk okuma

Menüde A/B Test Kategori Sıralaması: Tatlı Üstte vs Altta Deneyi

Bodrum Yalıkavak deniz restoranında 8 haftalık A/B testi: tatlı en üstte iken check ortalaması 412₺, en altta 387₺. p<0.05 anlamlı, çocuklu masada etki 3 katı.

th

thMenu Team

thmenu.com

Yalıkavak'taki sezonluk bir deniz restoranı, yıllık 4 ay açık kalıyor ve her hafta yaklaşık 2.400 check kapatıyor. Sahibi tek bir soruya cevap aramak istedi: tatlı kategorisini menü kartının en üstüne taşırsam check ortalaması gerçekten yükselir mi, yoksa bu sadece psikoloji blogu efsanesi mi?

Deney tasarımı: 8 hafta, 2 varyant, 4.872 check

QR menüde A varyantı tatlıları "Tatlılar" sekmesinde en üstte gösterdi, B varyantı geleneksel sırayla en altta bıraktı. Her masa giriş anında deterministik hash (table_id % 2) ile varyanta sabitlendi — aynı masa akşam boyunca aynı menüyü gördü. 8 hafta sonunda 2.487 check A varyantında, 2.385 check B varyantında kapandı.

Tatlı en üstte gösterilen masalarda check ortalaması 412₺, altta gösterilenlerde 387₺ oldu. Fark 25₺, yani %6,5. İstatistiksel anlamlılık testi (Welch t-testi) p=0,021 verdi — %95 güvenle gerçek bir etki.

Çocuklu masalarda etki 3 katı

Garson notlarıyla işaretlenen 612 "çocuklu masa" segmente edildiğinde fark çarpıcı şekilde büyüdü: A varyantında 478₺, B varyantında 401₺ — yaklaşık 77₺ fark. Çocuk fiyat hassasiyeti olmayan bir karar verici; ekrana ilk düşeni göstermek dondurma siparişini neredeyse refleksif hale getiriyor.

  • Tüm masalar: +%6,5 check ortalaması (412₺ vs 387₺)
  • Çocuklu masalar: +%19,2 check ortalaması (478₺ vs 401₺)
  • Romantik çift masaları: +%2,1 (anlamlı değil, p=0,31)

Bayesian mı, frequentist mi?

Klasik frequentist t-testi "evet, fark var" der ama sezonluk işletmede her hafta yeniden bakmak istersiniz — peeking problem'ı false positive üretir. Bu yüzden Bayesian beta-binomial modelle haftalık güncelleme yaptık: posteriora göre A'nın B'den iyi olma olasılığı 6. haftada %94'e çıktı, 8. haftada %98,3'e ulaştı. Karar netti.

Pratikte tavsiye: 1.000 check altındaki örneklemlerde Bayesian güncellemeyi tercih edin, üstünde frequentist t-testi yeterli. Her iki yöntem de aynı işareti veriyorsa rahatça karar verin.

FAQ

Test süresi kaç hafta olmalı? Günlük 50+ check yapıyorsanız 4 hafta yeterli olabilir; sezonluk restoran ve hafta sonu yoğunluğu için 6-8 hafta önerilir.

QR menüde A/B test nasıl uygulanır? Masa ID'sinin hash'iyle deterministik atama yapın; aynı masa her seferinde aynı varyantı görsün, aksi halde veri kirlenir.

Tatlıyı üstte bırakmak markaya zarar verir mi? Hayır — kategorik sıralama bir bilgi mimarisi kararıdır; fiyat veya görsel kimliği değiştirmediği için marka algısına etkisi ihmal edilebilir.

Faydalı buldunuz mu? Paylaşın.