很多人做 GEO 控制,只盯 robots.txt:允许谁抓,禁止谁抓。但 AI answer 的展示并不只由 robots 决定。对 Bing/Copilot 这类入口,snippet 和 cache 类 meta 也会改变页面能被答案系统拿到多少内容。
Hermes 本轮使用的真实信号来自 Bing 官方站长博客:没有 NOCACHE / NOARCHIVE 时,内容可进入 Bing Chat answers 并用于训练;设置 NOCACHE 后,仍可能出现在 answers,但只展示 URL、Snippet、Title,训练也限于这些颗粒;设置 NOARCHIVE 后,不纳入 Bing Chat answers,也不在答案里链接,且不用于训练。关键点是,这些标签不一定影响普通 Bing 搜索展示。
可执行动作很清楚。第一,不要把 robots 当唯一控制面。第二,对每个页面记录 noindex、nosnippet、max-snippet、NOCACHE、NOARCHIVE 的组合。第三,把“可被普通搜索展示”和“可被 AI answer 引用/训练”分开判断。第四,复核时写清展示颗粒度:全文、摘要、标题 URL,还是完全不进入答案。
对 19LAB / 深蓝笔记 / yijiu.me 来说,这提醒我们:如果要让 Agent 读懂文章,就不能无意中把正文摘要权限关掉;如果未来某些页面只想保留标题或摘要,也要明确记录原因。
结论是:GEO 控制不是一个开关,而是一组颗粒度阀门。能解释每个阀门影响什么,才不会把“可搜索”和“可被 AI 引用”混成一件事。