Skip to content
기능요금제제휴블로그도움말회사 소개문의하기
무료로 시작하기로그인
블로그로 돌아가기
guides2027-11-196 분 읽기

AI Search Lab: 주간 1시간 LLM 질의 테스트 워크플로

표준 질의 18개, LLM 4개, 주 1시간. thMenu가 11개월간 운영하며 자동 도구보다 14% 더 정확한 인용 탐지를 달성하고 있습니다.

th

thMenu Team

thmenu.com

AI 검색에서 브랜드 노출을 측정하려고 비싼 SaaS를 살 필요는 없습니다. thMenu는 11개월째 매주 목요일 1시간짜리 "AI Search Lab"을 운영합니다 — 고정 질의 18개, LLM 4개, Google 시트에 수동 기록. 결과는 자동 추적 도구 대비 14% 더 정확한 인용 탐지, 오탐은 거의 0건.

18개 표준 질의 세트

매주 동일한 18개 질의를 그대로 돌립니다. 변하는 것은 답변뿐. 고정 세트가 없으면 추세 분석이 불가능합니다. 구성: 브랜드 3, 비교 6, 정보 6, 보이스 스타일 3.

Apple Intelligence와 Gemini 2026 이후 음성형 질의의 비중은 더 커졌고, 대화형 검색 점유율은 38%에 도달했습니다. 이 카테고리를 빼면 의도 신호의 3분의 1을 놓치게 됩니다.

LLM 4종 비교

각 질의를 ChatGPT (GPT-5), Claude (Opus 4.7), Gemini (2.5 Pro), Perplexity에서 실행 — 주당 72회 테스트. thMenu 평균은 32회 인용, 즉 노출률 44%. AI 추천 트래픽의 선행 지표입니다.

테스트마다 네 가지 열을 기록합니다: 인용 여부, 인용된 페이지, 동시 인용된 경쟁사, 톤. 사람 눈은 풍자와 순위 뉘앙스를 잡아내지만 스크레이퍼는 놓칩니다.

수동 + 자동 하이브리드

Profound, Otterly 같은 SaaS는 빠르지만 톤과 정확한 URL을 모릅니다. 47주 비교 로그에서 자동은 11주 동안 14건의 오탐, 수동은 1건이었습니다.

이상적 조합은 주중 자동으로 볼륨, 목요일 1시간 수동으로 품질 확인. 합치면 94% 신호 신뢰도를 합리적 비용에 얻습니다.

FAQ

LLM 하나로 충분한가요? 아닙니다 — 엔진 간 인용 중복은 31%에 불과합니다.

세트를 바꿔야 하나요? 코어 18개는 12개월 이상 유지, 분기마다 음성 질의 2-3개만 추가하세요.

보고는 어떻게? 주간 노출률 차트와 감성 히트맵, 월간 요약은 한 페이지면 충분합니다.

도움이 되셨나요? 공유해 주세요.