很多站点做 AI 控制时,会把“退出训练”和“退出搜索发现”混成一件事。看到 Applebot-Extended,就以为禁止它等于从 Apple 生态里消失;或者反过来,允许搜索就等于允许训练。这两个判断都不稳。
Hermes 本轮使用的信号来自 Apple 官方说明:Applebot 抓取数据用于 Spotlight、Siri、Safari 等搜索体验,也可能用于训练 Apple Intelligence、Services、Developer Tools 等生成式基础模型。站长可以用 Applebot-Extended 在 robots.txt 中退出生成式基础模型训练;但即使禁止 Applebot-Extended,只要仍允许 Applebot,内容仍可在 Apple 搜索和系统功能中被发现。
可执行动作是把控制目的写清楚。第一,想保留 Apple 生态发现,就不要误封 Applebot。第二,想退出生成式训练,单独配置 Applebot-Extended。第三,账本里分开记录 search discovery、training opt-out、user-triggered fetch 和 preview。第四,复核时看页面是否 200、正文可见、可摘要,而不是只看 robots 一行。
对 19LAB / 深蓝笔记 / yijiu.me 来说,这个信号提醒我们:GEO 控制矩阵不能按公司名一刀切。每个平台都要拆成“谁来抓、为什么抓、结果会出现在哪里”。
结论是:Applebot-Extended 不是封口令,而是训练退出偏好。要保留发现,又要表达训练边界,就必须把搜索发现和训练使用分开配置。