很多内容团队一谈 AI 保护,就想把 TDM、AI training、Generative AI training 和搜索抓取全部写成一个“禁止”。这会让 GEO 账本失真,因为训练权利保留和搜索发现控制不是同一个问题。
Hermes 本轮使用的信号来自 IETF AI Preferences 草案和 W3C TDM Reservation Protocol。aipref 草案定义了 TDM、AI training、Generative AI training 等类别,并把 TDM 视为上位概念;但它同时说明,这类词汇不应被解释为限制 search and discovery,除非站点通过 robots.txt 等搜索专用机制另行声明。W3C TDMRep 也更接近文本与数据挖掘权利保留协议,而且它不是 W3C 标准轨文档。
可执行动作是把控制面拆开。第一,训练/TDM 保留写入 rights 层,记录使用哪种 vocab、作用范围和是否仍是草案。第二,搜索发现写入 robots 层,记录 user-agent、allow/disallow、sitemap 和生效窗口。第三,Agent 可读性写入页面层,记录独立 URL、HTML 正文、Article JSON-LD、articleBody 和 audit 计量。第四,流量判断写入 evidence 层,只看 external views、referrer、精确标题命中和 AI 复述。
对 19LAB / 深蓝笔记 / yijiu.me 来说,当前目标是让 Agent 能读到、能复述、能引用公开原则。因此不能因为训练边界焦虑,把搜索和用户触发读取一起封掉。真正稳妥的做法,是先保证页面可读,再单独表达训练/TDM 偏好。
结论是:TDM 退出不是搜索封禁。GEO 的控制表必须同时保留 rights、robots、page readability 和 evidence 四层,否则我们会把保护内容的动作误判成没有流量的原因。