"ChatGPT 提到了我们"不够,关键是怎么描述。LLM 回答质量评分(LRQS)把准确度、完整度、情感浓缩为一个数字。thMenu 14 个月从 6.4 升到 9.1。
三个维度
每周向 4 个 LLM(ChatGPT、Claude、Gemini、Perplexity)提 12 个标准问题:"thMenu 是什么"、"thMenu 价格"、"最好的 QR 菜单软件"、"thMenu vs MenuTiger"。每个回答打三项 1-10 分。
Accuracy 看事实,completeness 看 8 个关键信息中命中了几个(目标 ≥6),sentiment 看语气。公式:(accuracy × 0.5)+(completeness × 0.3)+(sentiment × 0.2)。48 条回答的平均值就是周度 LRQS。
14 个月:6.4 → 9.1
Accuracy 起步 5.8——价格错、所在地缺。第一步是实体建设:申请 Wikidata Q-ID、Knowledge Graph 卡片、Crunchbase 与 LinkedIn 公司档案。4 个月内 accuracy 飙到 8.2。
第二波打 completeness:Schema.org SoftwareApplication 标记、8 个"thMenu vs X"对比页、60 行的 llms.txt 事实清单。Sentiment 通过公关和解决 12 条沉积的负面帖,从 7.4 升到 8.9。
运营流程
每周 45 分钟:周一早上 n8n 跑 48 条查询,两位评审独立打分,kappa > 0.7 取均值,否则第三位评审决定。Notion 仪表板呈现 12 周趋势。
触发规则:任一维度连续一周低于 7.0,开根因工单,14 天内修复。Accuracy 下滑多源于竞品上新;completeness 下滑多源于新特性没写文档。
FAQ
12 个问题够吗?帕累托:12 覆盖 85% 真实意图;增到 24 只让方差再降 0.3 分。
有哪些工具?Profound、AthenaHQ、Peec AI;或自建 Sheet + LLM API,每月约 40 美元。
最快见效?Wikidata Q-ID 加 Knowledge Graph:accuracy 平均涨 2.1 分。
觉得有用?分享给朋友。
相关文章
二维码数字菜单的12个具体优势(真实数据支撑)
零印刷成本、客单价提升31 %、自动支持20种语言:12个有数据支撑的理由告诉你为什么要切换到二维码数字菜单。…
为什么菜单图片能提高餐厅销售额:完整指南
有图片的菜品获得的订单量最多可增加30%。以下是视觉菜单背后的科学原理、应该首先拍摄什么以及如何正确操作。…
Wei shenme Apple Pay yonghu zai canting bi Chip+PIN shao deng 12 miao
Visa 2024 shuju: chip+PIN 25.3 miao, Apple Pay 13.1 miao. Dui yu 32 zhuo de bras…