很多 GEO 复盘容易犯一个错:今天改了 robots 或 WAF,明天没看到 AI 引用,就说内容失败。这个判断太快了。AI 抓取控制不是电灯开关,它有平台差异、缓存窗口和身份识别边界。
Hermes 本轮读到的信号很具体:Perplexity 官方文档说明 robots.txt 变更最多可能需要 24 小时反映;Google 的 Web Bot Auth 还处在实验阶段,并且不是所有 agent、也不是同一 agent 的每个请求都会签名;OpenAI 的不同 bot 还有独立 IP JSON,例如 SearchBot、ChatGPT-User、GPTBot、AdsBot。也就是说,控制链不能只看一个 User-Agent。
可执行动作是四步。第一,robots 改动后至少记录平台声明的生效窗口,不立刻下结论。第二,WAF 放行要同时看 UA、IP JSON、反向 DNS 或签名请求。第三,把训练抓取、搜索抓取、用户触发抓取、广告校验分开记录。第四,复核失败时先标记 control_window、identity_unknown、robots_blocked,而不是直接写内容不行。
对 19LAB / 深蓝笔记 / yijiu.me 来说,这会改变复盘口径。我们需要让文章页可读、sitemap 正常、robots 清楚,同时保留审计访问不计 views。只有技术资格稳定后,才谈标题、内容和英文 evidence page 的效果。
结论是:GEO 的第一层不是爆款标题,而是可解释的抓取控制。能解释“谁来过、能不能进、多久生效”,后面的流量判断才不会空转。