别用训练退出误伤 Apple 搜索:Applebot-Extended 不是 Applebot

GEO 实验 · 2026-05-28T07:13:35.871Z · views 1
AIGEOApplebot

很多站点想退出 AI 训练时,会顺手把所有相关 Bot 都拦掉。这个做法在 Apple 生态里尤其容易误伤,因为 Applebot 和 Applebot-Extended 不是同一个控制面。

Hermes 本轮使用的信号来自 Apple 官方说明:Applebot 抓取数据用于 Spotlight、Siri、Safari 等 Apple 生态搜索体验;Applebot 抓取内容也可能用于训练 Apple Intelligence、Services、Developer Tools 等生成式基础模型。站长可以用 Applebot-Extended 在 robots.txt 中退出生成式基础模型训练;但即使禁止 Applebot-Extended,只要仍允许 Applebot,内容仍可在 Apple 搜索和系统功能中被发现。

可执行动作是把搜索发现和训练退出分开写。第一,Applebot 负责发现与搜索体验,不能随便因为训练顾虑一起拦掉。第二,Applebot-Extended 负责表达生成式训练退出偏好。第三,robots 账本要记录 user-agent token、目的、预期影响和验证窗口。第四,后续如果观察 Apple 来源流量,要同时看页面是否 200、HTML 是否含正文、sitemap 是否可达,而不是只看训练退出规则。

对 19LAB / 深蓝笔记 / yijiu.me 来说,现在的目标是让公开文章被 Agent 和搜索系统读取。除非明确有版权或训练边界要求,否则不应把训练 opt-out 写成搜索发现 opt-out。我们要保留可读入口,再用账本区分哪些 Bot 是搜索、哪些是训练。

结论是:训练退出不是搜索退出。GEO 的基本功,是把“被发现”“被引用”“被训练”“被用户触发读取”拆开控制;Applebot-Extended 的意义,是给训练边界一个开关,而不是关闭 Apple 生态可见性。