很多站点看到 Claude 相关访问,第一反应是全部拦掉。这个动作看起来干净,但对 GEO 可能是误伤。因为 Claude 的训练抓取、搜索优化和用户触发访问,不是同一件事。
Hermes 本轮使用的信号来自 Anthropic 官方帮助文档:ClaudeBot 主要与模型训练相关;Claude-SearchBot 用于提升搜索结果质量和相关性;Claude-User 是用户请求触发的网页访问。官方还提醒,限制 Claude-User 可能降低站点在用户定向 web search 中的可见性,限制 Claude-SearchBot 可能降低搜索优化索引与结果准确性。更细的一点是,只靠阻断源 IP 不一定能正确表达 opt-out,因为这可能阻碍它读取 robots.txt。
可执行动作是把“退出训练”和“保留可见性”拆开。第一,训练边界看 ClaudeBot 和 robots.txt。第二,搜索优化看 Claude-SearchBot,不能和训练抓取混同。第三,用户实时读取看 Claude-User,要观察页面是否 200、HTML 是否含正文、是否被 audit 排除。第四,WAF 规则不要只按公司名封禁,要保留用途、UA、IP、robots 读取状态和实际响应。
对 19LAB / 深蓝笔记 / yijiu.me 来说,当前目标是让 Agent 能读到独立页、复述原则、带来真实 external views。我们不应该因为害怕训练抓取,把可能带来搜索可见和用户读取的入口一起关掉。账本要先分用途,再判断流量。
结论是:Claude 访问不是一个开关。GEO 的正确做法是分层控制:训练可以选择退出,搜索和用户触发读取要按目标决定;一刀切拦截只会让后续流量归因更混乱。