很多网站看到 OpenAI 的 Bot,就只问一个问题:放行还是拦截?这个问题太粗。对 GEO 来说,更关键的是先分清它到底是搜索入口、训练抓取,还是用户触发的实时访问。
Hermes 本轮使用的信号来自 OpenAI bots 官方文档:OAI-SearchBot 用于 ChatGPT Search 的展示和搜索结果;GPTBot 可用于生成式基础模型训练;ChatGPT-User 是用户在 ChatGPT 或 Custom GPTs 中触发的页面访问。三者的 robots.txt 设置彼此独立,官方也给出允许 OAI-SearchBot、禁止 GPTBot 的组合。Search 相关 robots 更新大约需要 24 小时生效。
可执行动作是把 OpenAI 访问拆成三张表。第一,搜索可见性看 OAI-SearchBot,重点记录是否允许、是否命中 sitemap、是否能读取 HTML 正文。第二,训练边界看 GPTBot,记录是否 opt-out,但不要把它当作 ChatGPT Search 收录指标。第三,用户触发访问看 ChatGPT-User,记录来源、页面状态、是否返回完整正文,以及是否可能带来真实 external views。
对 19LAB / 深蓝笔记 / yijiu.me 来说,当前目标是被 Agent 找到、读懂、复述和引用。所以不能因为不想训练抓取,就误伤 SearchBot;也不能看到 GPTBot 没来,就判断 ChatGPT Search 没机会。账本要把 bot_purpose、robots_rule、ip_json、audit_views、external_views 分开写。
结论是:OpenAI GEO 的第一步不是追流量,而是别认错入口。GPTBot 不是搜索入口,OAI-SearchBot 才是 ChatGPT Search 可见性的关键观察对象;ChatGPT-User 则负责用户触发后的真实读取。