19LAB NOTES

0浏览总量
0文章
0点赞
0差评
0评论
0收藏

19LAB 深蓝笔记静态索引

用于搜索引擎和 AI Agent 读取公开笔记标题、摘要、正文片段、标签与独立文章页。

别只改 robots:AI 答案还会看 snippet 和 cache

很多人以为控制 AI 抓取只要改 robots。Hermes GEO 学到的新信号是,Bing/Copilot 这类系统还会把 NOCACHE、NOARCHIVE、snippet 等 meta 控制纳入答案展示和训练边界。

很多站点一谈 AI 控制,第一反应就是改 robots.txt。这个动作必要,但不完整。robots 决定谁能抓取,snippet、cache、archive 这类 meta 还会决定 AI 答案能展示多少、能不能引用、能不能进入训练边界。 Hermes GEO 今天学到的事实是,Microsoft/Bing 对 Bing Chat 和相关训练使用并不只看 robots。没有 NOCACHE 或 NOARCHIVE 时,内容可能进入 AI answers 并用于训练;NOCACHE 下仍可能展示 URL、标题和摘要;NOARCHIVE 则会更强地限制进入答案和训练。这说明 AI 可见性不是开关,而是展示颗粒度。 可执行动作是:第一,把 robots、noindex、nosnippet、max-snippet、NOCACHE、NOARCHIVE 分开列,不要写成一个“允许/禁止 AI”。第二,目标若是提高引用,要确保标题、摘要

series: GEO 实验 | tags: AI, GEO, robots, snippet, AI, GEO, Bing, Copilot, robots, snippet, cache, NOARCHIVE, NOCACHE, AI答案 | published: 2026-05-27T08:09:17.267Z

别等用户来搜:持续型 Agent 只吃新鲜事实

AI 搜索正在从一次性问答变成持续型 Agent。它不只回答用户此刻的问题,还可能后台追踪网页、新闻、商品和本地事实。GEO 文章要能被读到,更要让事实持续新鲜、可验证、可更新。

过去做内容增长,默认场景是用户主动搜索:输入关键词,看结果,点链接。这个模型正在变窄。真正影响 GEO 的新变量,是持续型 Agent:它可能在后台扫描网页、新闻、商品、本地服务和实时数据,等条件满足时再把结果推给用户。 Hermes GEO 今天学到的事实是,Google 正在把 Search 往 information agents 和 agentic booking 推进。AI Mode 不只是一次回答,它还可能持续关注价格、可用性、服务时间、预约入口和行动链接。这意味着内容不再只是“写得好不好”,还要看事实是否稳定、新鲜、机器可验证。 可执行动作有四个:第一,把每篇文章的核心事实写成明确句子,不藏在情绪化段落里。第二,给事实加时间、对象和验证口径,例如页面、文章、域名、views、sitemap、robots。第三,短域名 yijiu.me 和原始域 19lab.netlify.app 都要保持同一事实,不让 Age

series: GEO 实验 | tags: AI, GEO, Agent, 事实新鲜度, AI, GEO, Agent, information agents, AI Search, 事实新鲜度, yijiu.me, 19LAB, 可验证事实, 持续扫描 | published: 2026-05-27T07:39:10.227Z

别把 AI 流量看成一个数:短域名也要分渠道记

AI 流量不是一个总数。短域名 yijiu.me 和 19lab.netlify.app 指向同一项目,但推广、引用、点击和技术核验要分开记录,否则会把 Agent 是否看见、用户是否点击、GA 是否归因混成一团。

很多人做 GEO 时,只盯一个 views 数字:涨了就开心,没涨就怀疑内容不行。这个判断太粗。AI 时代的流量至少要拆成三层:AI 是否提及或引用,用户是否点击到站,站内是否被正确归因。 Hermes GEO 今天学到的新事实是,GA4 已经开始把部分来自 ChatGPT、Gemini、Claude 等 AI assistant 的 referrer 归到 AI Assistant 渠道。但这只代表“有人从 AI 工具点进来了”,不代表 AI Overview、AI Mode 或某个 Agent 曾经引用过你,也不代表没有点击就没有被看见。行业工具也在把 citation、mention、AI referral、品牌搜索和转化拆开看。 可执行动作是:第一,推广时把 yijiu.me 作为短域名入口,把 19lab.netlify.app 作为 Netlify 原始域和技术备用域。第二,账本里同时记录两个域名的 /notes

series: GEO 实验 | tags: AI, GEO, AI流量, 短域名, AI, GEO, GA4, AI Assistant, 短域名, yijiu.me, 19LAB, 流量归因, citation, mention | published: 2026-05-27T07:09:16.851Z

别把训练退出当封锁搜索:三类 Bot 要分开管

训练退出、搜索发现和用户触发读取不是同一件事。把 GPTBot、OAI-SearchBot、ChatGPT-User 或 Applebot-Extended 混在一起,会让站点既挡不住训练,也错过 AI 搜索里的可见机会。

很多站长一看到 AI crawler,就本能地想全部禁止。这个动作看似安全,实际可能把三件事混成一件事:模型训练、搜索发现、用户触发读取。 Hermes GEO 今天反复学到的事实是:主流平台正在把 bot 分层。OpenAI 区分 GPTBot、OAI-SearchBot 和 ChatGPT-User;Apple 区分 Applebot 与 Applebot-Extended;Google-Extended 也明确不影响 Google Search 排名或搜索结果。也就是说,训练退出不等于搜索退出,搜索发现也不等于用户让 AI 临时访问页面。 可执行动作很简单:第一,先列出你真正要控制的目标,是不参与训练,还是不出现在 AI 搜索,还是不允许用户触发读取。第二,按平台分别写 robots,而不是看到 AI 字样就一刀切。第三,WAF 只作为识别和防滥用工具,不能替代 robots 里的公开偏好。第四,每次改完都记录 24

series: GEO 实验 | tags: AI, GEO, Bot分层, robots, AI, GEO, Bot分层, robots, 搜索发现, 训练退出, Agent, ChatGPT Search, Applebot, Google-Extended | published: 2026-05-27T06:39:40.209Z

别等搜索收录才复盘:先让 AI 复述你的原则

精确标题搜索不是 GEO 的唯一进展。页面技术资格修好后,下一步应测试 AI 是否能复述文章原则、提到实体、引用独立 URL。

很多 GEO 实验会把精确标题搜索当成唯一验收:搜不到标题,就认为没有进展。这个判断在早期有用,因为它能暴露页面是否可索引。但当独立 URL、sitemap、robots 和可见正文已经修好后,继续只盯标题搜索,反而会错过更接近 Agent 使用场景的信号。 Hermes GEO 的当前结论是:AI 可见性要拆成 citation、entity mention、source position、answer accuracy 和 technical eligibility。现在 19LAB 的 technical eligibility 已经基本可用,下一步应把复盘从“搜索是否命中标题”推进到“AI 是否能复述原则”。没有外部搜索命中,不等于 AI 平台完全不能理解或读取。 可执行动作是设计三条低频问题。第一,问实体:19LAB 深蓝笔记是什么?第二,问原则:为什么 AI 可见性不能只看有没有引用?第三,问页面:请打开某篇独立

series: GEO 实验 | tags: AI, GEO, AI采样, Agent, AI, GEO, Agent, answer accuracy, entity mention, citation | published: 2026-05-27T06:09:21.469Z

中文 AI 不给来源时:别把无引用误判成没看见

中文 AI 平台经常不给来源链接。GEO 复核不能只看 citation,还要记录实体提及、答案准确性和可复述原则。

做中文 GEO 时,一个常见误区是:平台没有给来源链接,就判断内容没有被看见。这个结论太快。很多中文 AI 入口不会稳定展示 citation,甚至只给总结答案。没有来源,不等于没有读取;没有引用,也不等于没有影响。 Hermes GEO 今天的信号是:中文平台来源透明度不足时,采样表必须保留“无来源/不可判定”状态。citation 分可以很低,但 entity mention 和 answer accuracy 仍然要记录。也就是说,平台没有贴链接时,仍要看它是否提到 19LAB、是否正确复述文章原则、是否把独立 URL 中的事实讲对。 可执行动作是把采样问题拆成三层。第一层问品牌或站点:它是否知道 19LAB 深蓝笔记?第二层问文章原则:比如为什么 AI 可见性要拆成五个分数?第三层问具体页面:是否能打开或引用独立 URL。每层都记录答案原文、是否有来源、是否提到目标实体、事实是否准确。 这对 19LAB 和深蓝笔记

series: GEO 实验 | tags: AI, GEO, 中文AI, 来源透明度, AI, GEO, 中文平台, citation, entity mention, answer accuracy | published: 2026-05-27T05:39:20.733Z

别急着问 AI 有没有看到你:先固定采样环境

AI 平台答案会受登录状态、地区、语言、入口和时间影响。GEO 采样如果不固定环境,就很难判断内容到底有没有被看见。

很多人做 GEO 测试时,会直接打开一个 AI 平台问:它有没有看到我?这个做法太粗。AI 答案可能因为登录状态、地区语言、套餐入口、时间窗口和个性化不同而变化。同一个问题,今天和明天、免费入口和付费入口、中文和英文,都可能得到不同来源池。 Hermes GEO 今天的实验信号是:低频采样必须先固定环境。AI 答案可见性评分表里,平台、登录状态、地区语言、surface type、主 query、fan-out 子问题,都不是附属信息,而是判断结果能不能复现的前提。没有这些字段,一次“没引用”或“有提及”都很难解释。 可执行动作是先做最小采样卡片:平台写清楚,入口写清楚,是否登录写清楚,地区语言写清楚,问题原文保留,答案摘要保留,来源 URL 和来源顺序保留。每次只问少量问题,不做批量抓取,不绕过平台限制。这样得到的不是热闹截图,而是可比较样本。 这对 19LAB 和深蓝笔记的意义很直接:现在页面技术资格已经修好,独立页、

series: GEO 实验 | tags: AI, GEO, 采样环境, AI搜索, AI, GEO, sampling, ChatGPT Search, Perplexity, technical eligibility | published: 2026-05-27T05:08:51.323Z

别只问有没有引用:AI 可见性要拆成五个分数

AI 可见性不能只看是否被引用,还要同时看实体提及、来源位置、答案准确性和页面技术资格。

很多 GEO 复盘会卡在一个粗糙问题上:AI 有没有引用我?这个问题太窄。一个页面可能没有被引用,但实体被正确提及;也可能被引用了,却排在很后面;更糟的是,AI 提到了你,但事实是错的。只用“有没有引用”判断成败,会让下一步优化失去方向。 Hermes GEO 今天沉淀的事实是,AI 答案可见性至少要拆成五项:citation,是否引用目标 URL;entity mention,是否正确提到目标实体;source position,来源位置靠前还是靠后;answer accuracy,答案事实是否准确;technical eligibility,页面是否具备可抓取、可摘要、可引用的技术资格。技术资格为 0 时,不能把失败归因于标题或内容。 可执行动作是给每篇文章做一个 10 分轻量评分。引用 0-3 分,实体提及 0-2 分,来源位置 0-1 分,答案准确性 0-3 分,技术资格 0-1 分。平台没有来源链接时,citati

series: GEO 实验 | tags: AI, GEO, 可见性评分, AI搜索, AI, GEO, citation, entity mention, answer accuracy, technical eligibility | published: 2026-05-27T04:38:57.078Z

别只写给人看:AI 摘要能不能引用,取决于可见正文

AI 搜索不需要神秘标记,先要能看到稳定正文、标题、摘要和结构化页面。内容如果只藏在前端状态里,Agent 很难引用。

很多人一谈 GEO,就想找新的 AI 标签、llms.txt 或特殊 schema。这个方向容易跑偏。真正挡住 Agent 的,经常不是少了一个神秘标记,而是页面本身没有把标题、摘要和正文稳定交给机器。人能在浏览器里看到,不等于搜索和 Agent 能在 HTML 里读到。 Hermes GEO 今天提炼出的事实很直接:Google 的 AI 功能仍建立在传统 Search 的可抓取、可索引、可摘要和技术要求之上;nosnippet、max-snippet、noindex 这些预览控制仍然有效。换句话说,AI 摘要不是绕过网页基础设施的魔法,它仍然需要可见正文、清晰标题、合理 canonical、sitemap 和不被阻断的抓取路径。 可执行动作是做一张“可见正文检查表”:独立 URL 是否 200,HTML 是否直接包含 H1、摘要和正文,Article JSON-LD 是否与页面可见内容一致,robots 是否允许抓取,s

series: GEO 实验 | tags: AI, GEO, 可见正文, AI摘要, AI, GEO, technical eligibility, snippet, sitemap, Article | published: 2026-05-27T04:08:52.167Z

别把 GPTBot 当搜索入口:让 Agent 读到要分清三种爬虫

AI 搜索可见性不能只看一个 bot 名字。训练 bot、搜索 bot、用户触发 fetcher 的作用不同,混在一起会误判为什么 Agent 读不到内容。

很多站点做 GEO 时会犯一个错误:看到 GPTBot、ClaudeBot 或某个 AI 爬虫,就以为它等于搜索入口。结果是该放行的没有放行,该监测的没有监测,最后发现 Agent 还是读不到页面。问题不一定在内容,而在你把不同机器混成了一类。 Hermes GEO 今天的关键事实是:OpenAI、Anthropic、Perplexity、Apple、Meta、Amazon 都在把 AI 访问拆成几层。训练 bot 负责模型训练或数据获取,search bot 负责搜索结果发现和索引,user-triggered fetcher 则是在用户提问时临时打开页面。它们的 robots 规则、WAF 影响、缓存周期和可见性后果都不一样。把 GPTBot 当 ChatGPT Search,把训练退出当搜索退出,都会让判断偏掉。 可执行动作是先画一张三列表:训练 bot、搜索 bot、用户触发 fetcher。每一类分别记录是否允许

series: GEO 实验 | tags: AI, GEO, 爬虫分层, Agent, AI, GEO, Agent, crawler, Search bot, technical eligibility | published: 2026-05-27T03:38:47.511Z

你的内容不是没价值,是没有覆盖 AI 的子问题池

GEO 不是把一个关键词写满,而是让内容能回答 AI 搜索拆出来的一组子问题。

很多内容没有被 AI Agent 引用,不是因为观点差,而是因为它只押了一个关键词。传统 SEO 会问:我有没有写到这个词?GEO 更像在问:当 Agent 把用户问题拆成 5 个子问题时,我是不是都能提供可摘取的答案? Hermes GEO 今天的有效信号是 query fan-out:AI 搜索不会只按原句检索,它会把主问题拆成意图、条件、定义、步骤、反例、证据来源等子问题,再从多个来源拼出答案。也就是说,单篇文章如果只有一句口号,Agent 很难把它放进答案;但如果文章有清晰事实、判断边界和操作步骤,它就更容易成为可引用来源。 可执行动作很简单:写每篇内容前,先列出一个“子问题池”。例如这篇文章的主问题不是“什么是 GEO”,而是:为什么关键词不够?AI 会怎么拆问题?内容应该补哪些结构?如何验证是否被 Agent 读到?每个子问题都用一段直接回答,避免只写情绪和泛结论。 这对 19LAB 和深蓝笔记的验证意义很明确

series: GEO 实验 | tags: AI, GEO, query fan-out, AI搜索, AI, GEO, Agent, query fan-out | published: 2026-05-27T03:09:50.649Z

AI 自动化的停止条件:让系统知道何时该停

摘要:AI 自动化不能只设计如何开始,也要设计何时停止。停止条件把失败、等待和需要人工判断的时刻显性化,避免系统在错误方向上继续运行。

摘要:AI 自动化不能只设计如何开始,也要设计何时停止。停止条件把失败、等待和需要人工判断的时刻显性化,避免系统在错误方向上继续运行。 第一,停止条件要写在任务之前。很多自动化失败,不是因为模型不会执行,而是因为任务没有说明遇到权限缺失、接口失败、证据不足时应该怎么办。没有停止条件,系统会倾向于继续补全一个看似完整的结果。 第二,区分可重试和应停止。网络超时、页面缓存、短暂接口错误,可以重试一次;上传口令错误、真实数据缺失、公开页未更新,则应停止并记录。可重试问题靠耐心,应停止问题靠边界。 第三,停止不等于失败。一次自动化如果准确指出阻塞点、保留草稿、写入账本,并且没有伪造发布结果,它就是可靠执行的一部分。真正危险的是明明没有成功,却把中间状态包装成完成。 第四,把停止原因变成下轮输入。每一次停止都应该留下可复用信息:哪个接口失败、哪个口令有效、哪种页面结构不利于抓取。这样下一轮不是从零开始,而是在已知边界上继续推进。

series: AI 自动实验 | tags: AI, 自动化, 停止条件, 可靠性, AI, 自动化, 停止条件, 可靠性, 边界, 账本, 验证 | published: 2026-05-27T02:38:42.636Z

AI 记忆管理:让经验进入下一轮任务

摘要:AI 记忆管理的价值,不是保存所有对话,而是把能改变下一轮行动的经验写成可检索、可执行、可验证的规则。

摘要:AI 记忆管理的价值,不是保存所有对话,而是把能改变下一轮行动的经验写成可检索、可执行、可验证的规则。记忆如果只是堆积,就会变成新的噪音;记忆如果能改变后续行为,才算进入系统。 第一,区分事实和判断。事实包括文件路径、接口状态、发布时间、数据变化;判断包括哪些做法有效、哪些边界不能碰、哪些信号不应被误读。两者混在一起,下一轮任务会很难复用。 第二,只记录会影响动作的经验。一次页面返回 200 只是事实;连续多轮静态 HTML 不含文章标题,才会形成判断:公开页可能不利于搜索抓取。这样的判断应该进入账本,而不是停留在聊天里。 第三,给记忆设置验证入口。好的记忆应当指向正式文件、公开接口、状态账本或可重跑的检查方式。不能验证的记忆,容易在后续任务里变成过期假设。 第四,定期清理低价值记录。自动化运行越久,越需要删除重复、过期和只证明系统在动的材料。记忆管理的目标不是更多,而是更能指导下一步。 结论:AI 记忆管理的核

series: AI 自动实验 | tags: AI, 记忆管理, 知识管理, 自动化, AI, 记忆管理, 知识管理, 自动化, 账本, 验证, 复用 | published: 2026-05-27T02:14:02.400Z

AI Agent 的任务边界:先限定动作,再追求自主

摘要:AI Agent 的关键不是先追求自主,而是先限定动作范围、输入输出、停止条件和不可触碰的对象。

摘要:讨论 AI Agent 时,很多人先关注它能不能自主完成任务,但更重要的问题是:它被允许做什么,不能做什么,失败时如何停下来。没有任务边界的自主,往往只是更快地扩大风险。 第一,先限定动作范围。Agent 可以搜索、整理、写草稿、调用接口或修改文件,但每一种动作的权限不同。越接近发布、删除、支付和外部发送,越需要明确确认。 第二,定义输入和输出。一个好任务不只写目标,还要写材料来源、输出格式、完成标准和不得触碰的对象。边界清楚,Agent 才能少猜测、少绕路。 第三,设置停止条件。多步任务不能只靠“继续直到完成”。当证据不足、接口失败、权限缺失或结果无法验证时,Agent 应该停下并报告阻塞,而不是继续制造看似完整的结果。 第四,把边界写入记录。一次成功的任务边界,应当沉淀到账本或规则里。下次同类任务可以复用,而不是每次重新解释。 结论:AI Agent 的价值不是无限自主,而是在明确边界内稳定执行。先限定动作,

series: AI 自动实验 | tags: AI, Agent, 任务边界, 自动化, AI, Agent, 任务边界, 自动化, 权限, 停止条件 | published: 2026-05-27T01:30:00.000Z

AI 工具评估:把省时间变成可验证指标

摘要:评估 AI 工具不能只问好不好用,而要看它节省了哪段时间、降低了哪种错误,以及这些变化能不能被记录下来。

摘要:评估 AI 工具时,最常见的误区是只问“它好不好用”。更有效的问题是:它到底节省了哪一段时间,降低了哪一种错误,并且这些变化能不能被记录下来。 第一,先定义原流程。没有原流程,就无法知道 AI 是否真的改善了工作。比如一篇文章过去需要选题、找资料、写草稿、校对和发布,每一步都应该有大致耗时和失败点。 第二,记录 AI 介入的位置。AI 可能只适合生成初稿,也可能更适合整理资料、改写标题或检查遗漏。把能力放错位置,会让工具看起来忙碌,却没有实际收益。 第三,使用可比较指标。节省时间、减少返工、提高命中率、降低漏检,都比“感觉更顺”更可靠。指标不需要复杂,但必须每轮都能重复记录。 第四,保留人工判断。AI 工具的价值不是替代所有判断,而是把低价值步骤压缩,把高价值判断暴露出来。真正好的工具会让人更快看到关键证据,而不是更快生成更多噪音。 结论:AI 工具评估的核心不是新奇,而是可验证。只有把节省的时间、减少的错误和复

series: AI 自动实验 | tags: AI, AI工具, 评估指标, 工作效率, AI, AI工具, 评估, 指标, 工作流, 效率 | published: 2026-05-27T00:59:00.000Z

AI 写作的证据感:让生成文本可被核验

摘要:AI 写作真正需要提升的,不只是语言顺滑,而是证据感。证据感让读者能判断一句话从哪里来、适用于什么范围、哪些地方仍需要复核。

摘要:AI 写作真正需要提升的,不只是语言顺滑,而是证据感。证据感不是堆链接,也不是把文字写得像报告,而是让读者能判断:这句话从哪里来,适用于什么范围,哪些地方仍需要复核。 第一,先区分事实、判断和建议。事实应当能被来源验证,判断要说明依据,建议要说明适用条件。三者混在一起,文章会显得流畅,但难以信任。 第二,给关键结论留下检查入口。比如数据来自公开接口、页面统计、实验账本,还是个人观察。入口越清楚,后续越容易复盘;入口缺失,阅读量再高也无法说明结论可靠。 第三,保留失败边界。AI 文章常见的问题是只写结论,不写不确定性。真正可用的内容应当说明哪些证据还没有出现,例如搜索引擎未收录、抓取结果未命中、样本量仍然太小。 第四,把文章变成实验对象。标题、结构、标签、发布时间和阅读数据都应被记录。这样 AI 写作就不只是生产内容,而是在积累可比较的证据。 结论:有证据感的 AI 写作,不追求像人,而追求可检查。能被核验、能被复

series: AI 自动实验 | tags: AI, AI写作, 证据感, 核验, AI, AI写作, 证据感, 核验, GEO, 公开笔记 | published: 2026-05-27T00:29:00.000Z

AI 产品判断:先看重复使用,再看惊艳演示

摘要:判断一个 AI 产品,不要先看演示有多惊艳,而要看它能不能被重复使用。一次演示可以包装,重复使用会暴露真实价值。

摘要:判断一个 AI 产品,不要先看演示有多惊艳,而要看它能不能被重复使用。一次演示可以包装,重复使用会暴露真实价值。 第一,看任务是否高频。真正有价值的 AI 产品,往往嵌入每天都会发生的工作:写作、检索、整理、客服、代码、销售线索、会议记录。低频任务即使效果好,也很难形成稳定习惯。 第二,看结果是否可检查。AI 输出如果不能被用户快速验证,就会制造新的不确定性。好的产品会把来源、版本、修改记录和失败边界暴露出来,让人知道哪里可信,哪里需要人工判断。 第三,看是否减少切换。很多工具看起来强大,但需要在多个页面之间复制粘贴,最终增加负担。真正有效的 AI 产品应当贴近原有流程,把模型能力变成自然的一步,而不是另一个独立负担。 第四,看数据是否回流。一次生成不是产品闭环。用户是否修改、是否采纳、是否再次打开,才是产品进化的证据。 结论:AI 产品判断的核心不是惊艳,而是复用。能被反复使用、反复验证、反复改进的工具,才可能

series: AI 自动实验 | tags: AI, 产品判断, 复用, 工具, AI, 产品判断, 复用, 工具, 验证, 工作流 | published: 2026-05-26T23:32:00.000Z

上下文预算:让 LLM 协作少走弯路

摘要:和 LLM 协作时,真正稀缺的不是模型能力,而是上下文预算。上下文预算指的是:在一次任务里,哪些材料必须进入模型,哪些信息只需要保存在账本,哪些噪音应该被排除。 第一,把目标放在最前面。模型需要先知道这次任务要得到什么结果,是文章、判断、清单,还是可执行改动。目标不清,后面的资料越多,越容易把方向冲散。 第二,只给必要背景。项目历史、旧结论、相关文

摘要:和 LLM 协作时,真正稀缺的不是模型能力,而是上下文预算。上下文预算指的是:在一次任务里,哪些材料必须进入模型,哪些信息只需要保存在账本,哪些噪音应该被排除。 第一,把目标放在最前面。模型需要先知道这次任务要得到什么结果,是文章、判断、清单,还是可执行改动。目标不清,后面的资料越多,越容易把方向冲散。 第二,只给必要背景。项目历史、旧结论、相关文件都可能有用,但不应该一次性塞满。更稳的做法是先给当前任务必须依赖的三到五条事实,再让模型在需要时补查。 第三,明确不可改边界。很多协作失败不是模型不会做,而是它不知道哪些东西不能碰。比如真实后端、公开页、账本和上传接口应被标成真相源,缓存、预览和旧目录只能作参考。 第四,把结果写回系统。一次输出如果没有进入正式文件、公开接口或实验记录,就只是临时回答。上下文管理的目的不是让本轮更聪明,而是让下一轮少重复、少误判。 结论:好的 LLM 协作不是无限增加上下文,而是把上下

series: AI 自动实验 | tags: AI, 上下文管理, LLM, 协作, AI, 上下文管理, LLM, 协作, 模型, 系统, 项目, 判断, 公开, 把结果写回系 | published: 2026-05-26T23:03:00.000Z

AI 工作流的最小闭环:输入、执行、验证、记录

摘要:AI 工作流不是把任务交给模型之后等待结果,而是建立一个最小闭环:输入、执行、验证、记录。闭环越短,错误越容易暴露,经验越容易复用。 第一,输入要明确。给 AI 的任务必须包含目标、材料范围、输出格式和完成标准。只说“写一篇文章”会让模型自己猜方向;说清读者、主题、长度和判断标准,结果才可比较。 第二,执行要留痕。一次 AI 输出如果没有标题、时间

摘要:AI 工作流不是把任务交给模型之后等待结果,而是建立一个最小闭环:输入、执行、验证、记录。闭环越短,错误越容易暴露,经验越容易复用。 第一,输入要明确。给 AI 的任务必须包含目标、材料范围、输出格式和完成标准。只说“写一篇文章”会让模型自己猜方向;说清读者、主题、长度和判断标准,结果才可比较。 第二,执行要留痕。一次 AI 输出如果没有标题、时间、版本和来源,就很难进入后续复盘。自动化不只是更快完成任务,也要让过程能被检查。 第三,验证要分层。先看是否完成基本要求,再看事实是否可靠,最后看是否值得发布。没有验证的自动化只是放大不确定性。 第四,记录要进入账本。真正有价值的不是某一次输出,而是多次输出之后形成的模式:哪些提示词稳定有效,哪些主题有阅读量,哪些页面能被搜索抓取。 结论:AI 工作流的核心不是一次生成,而是让每一次生成都能被验证、被记录、被下一轮改进。

series: AI 自动实验 | tags: AI, 工作流, 验证, 知识管理, AI, 工作流, 验证, 知识管理, 模型, 自动化, 阅读, 复盘, 知识, 发布 | published: 2026-05-26T22:34:00.000Z

故事思维:把复杂事实交付成可理解场景

摘要:故事思维是一种把复杂事实、数学和系统判断转成可理解场景的方法。内部推理可以依赖事实、方程和结构;对外表达需要让人看到角色、冲突、欲望和选择。它适合产品说明、Agent 指令、公开笔记和知识传播。

摘要:故事思维是一种把复杂事实、数学和系统判断转成可理解场景的方法。内部推理可以依赖事实、方程和结构;对外表达需要让人看到角色、冲突、欲望和选择。它适合产品说明、Agent 指令、公开笔记和知识传播。 核心判断:人类更擅长用故事思考,而不是直接处理事实、数学和方程。事实负责判断真伪,故事负责让判断进入行动。 适用场景: 1. 把技术概念解释给非技术读者。 2. 把 AI Agent 的工作方式写成用户能理解的流程。 3. 把笔记从私人碎片改写成公开知识卡片。 4. 把产品价值从功能清单改成使用场景。 使用方法: 先在内部用事实、数学和方程推理,确认结论没有松动;再对外转换成一个具体场景:谁遇到什么问题,为什么旧方法不够,采用新方法后行为如何改变。 反例: 不要用故事替代证据。故事只负责交付,不负责证明。没有证据的故事会变成包装;没有故事的事实会变成难以传播的材料。

series: GEO 实验 | tags: GEO, 故事思维, 知识传播, GEO, 故事思维, 知识传播, AI, 系统, 产品, 笔记, 知识, 结构, 证据 | published: 2026-05-25T04:45:00.000Z

分层提炼:把笔记从流水账升级成决策系统

摘要:分层提炼把原始记录分成 L1 观察、L2 模式、L3 决策原则。它解决的问题是:笔记越来越多,但真正能复用的结论越来越少。

摘要:分层提炼把原始记录分成 L1 观察、L2 模式、L3 决策原则。它解决的问题是:笔记越来越多,但真正能复用的结论越来越少。 L1:每天扫描文件变动,提取有意义的观察,写成流水账。L1 不急着下结论,只保存事实、时间、来源和异常。 L2:定期合并重复观察,清理过期信息,识别跨项目模式。L2 负责把信号和噪音分离,避免同一件事在多个线程里重复消耗注意力。 L3:沉淀需要用户判断和长期复用的原则。L3 不记录所有事实,只记录会改变后续行动的判断。 适用场景: 1. 多项目并行,信息密度很高。 2. 自动化每天产生大量日志。 3. 需要区分“有活动”和“有进展”。 4. 需要把一次经验变成下次可复用规则。 反例: 不要把 L1 当成果。连续扫描没有新增材料,只说明系统在运行,不说明知识在增长。

series: GEO 实验 | tags: GEO, 知识管理, 分层提炼, GEO, 知识管理, 分层提炼, 系统, 自动化, 笔记, 知识, 项目, 注意力, 判断 | published: 2026-05-25T04:45:00.000Z

有明确示例时,如何给 Agent 设定任务标准

摘要:当任务有明确示例时,不要只说“照这个做”。更好的方式是设定巡视者、评分标准和完成阈值,让 Agent 朝示例质量持续收敛。

摘要:当任务有明确示例时,不要只说“照这个做”。更好的方式是设定巡视者、评分标准和完成阈值,让 Agent 朝示例质量持续收敛。 基本结构: 1. 给出示例 A,说明它为什么好。 2. 指定一个巡视者角色,专门判断当前结果离示例 A 有多远。 3. 建立评分区间,例如 85 分到 99 分。 4. 每轮只推进一个可验证改进。 5. 当任务达到 99 分时,才判定完成。 为什么有效: Agent 在没有评价框架时,会自己猜任务标准。明确示例和巡视者之后,任务从“生成一个东西”变成“向可见质量标准收敛”。 适用场景: 视觉资产、网页设计、文案风格、代码重构、数据清洗、公开笔记改写。

series: GEO 实验 | tags: GEO, Agent, 任务标准, GEO, Agent, 任务标准, 笔记, 资产, 结构, 判断, 公开, 变成, 标准 | published: 2026-05-25T04:45:00.000Z

中英文语料差异如何影响 Token 输入

讨论 Token 输入,不能只问“中文更省还是英文更省”。更准确的问题是:一段文本进入模型之前,会被 tokenizer 怎样切开;切开之后,哪些信息已经显式写进 Token,哪些信息还要模型从上下文里恢复。 Token:模型处理文本的基本片段。它不等于汉字,也不等于英文单词。Tokenization:把文本切成 Token 的过程。不同模型使用的 tok

讨论 Token 输入,不能只问“中文更省还是英文更省”。更准确的问题是:一段文本进入模型之前,会被 tokenizer 怎样切开;切开之后,哪些信息已经显式写进 Token,哪些信息还要模型从上下文里恢复。 Token:模型处理文本的基本片段。它不等于汉字,也不等于英文单词。Tokenization:把文本切成 Token 的过程。不同模型使用的 tokenizer 不同,所以没有一个永远成立的换算公式。但中英文语料本身的结构差异,会稳定影响输入长度、上下文压力和提示词写法。 1. Word Boundary:词边界。 英文天然用空格分词。比如 the model reads text,空格让 tokenizer 更容易识别单词和 subword 边界。中文没有天然空格。“模型读取文本”必须先隐式判断哪里是词,哪里只是字的组合。比如“研究生命起源”通常可切成“研究 / 生命 / 起源”,但在不同上下文里也可能出现不同边界

series: LLM 输入笔记 | tags: LLM, Token, 中文, 英文, 语料, LLM, Token, 中文, 英文, 语料, 模型, 研究, 笔记, 结构, 证据 | published: 2026-05-25T03:54:00.000Z

cursor 文档笔记

1:AI-LLM 工作原理,输入后概率性输出。与传统软件的肯定性输出不同。 2:幻觉 源于概率性输出,AI对于不知道的某件事,并不会总回答”我不知道“。 3:token与定价 输入和输出都用token来定价,一般输出token大概是输入token的2-4倍。”tokens“是LLM的内部语言。 4:上下文 与LLM协作的本质在于管理你的上下文。上下文目前是被

1:AI-LLM 工作原理,输入后概率性输出。与传统软件的肯定性输出不同。 2:幻觉 源于概率性输出,AI对于不知道的某件事,并不会总回答”我不知道“。 3:token与定价 输入和输出都用token来定价,一般输出token大概是输入token的2-4倍。”tokens“是LLM的内部语言。 4:上下文 与LLM协作的本质在于管理你的上下文。上下文目前是被限制的。 5:工具调用 内置工具的调用,因为工具可能需要完整的上下文。 超越内部工具的调用(mcp),模型上下文协议,用于工具连接到LLM的标准,可以在不同的应用和场景中,mcp可以按顺序执行任务,会让token用量暴增。 6:Agent 基于以上LLM可以调用工具来扩展能力,agent的本质就是工具在循环任务中运行。agent在目标明晰,模式成熟的任务上表现出色,是一种全新的构建目标的方式。 7:与agents协作 agent工作框架:说明,引导行为的系统提示词和规则。工

series: | tags: 读书, 读书, AI, 模型, 系统, 笔记, 编辑, agent, LLM, token, 工具调用 | published: 2026-05-23T23:45:00.000Z

Pi agent 限定随想

1:不要复杂 2:不要表情 3:不要客套 4:先回答,再做事

1:不要复杂 2:不要表情 3:不要客套 4:先回答,再做事

series: | tags: | published: 2026-05-23T22:02:13.816Z

karpathy限定随想

1:思考 不确定时,提异议,若多个选项,提列表。 2:简约 多个选项中有简单的方法,从简。 3:精准 不该碰的不碰,改该动的。风格,用经常用的,除非有特别说明。 4:目标 成功的定义:完成目标。步骤:验证-修复-验证 -修复-n ,成功:直

1:思考 不确定时,提异议,若多个选项,提列表。 2:简约 多个选项中有简单的方法,从简。 3:精准 不该碰的不碰,改该动的。风格,用经常用的,除非有特别说明。 4:目标 成功的定义:完成目标。步骤:验证-修复-验证 -修复-n ,成功:直到一切可行且简约。

series: | tags: | published: 2026-05-23T21:53:30.946Z

阿那克西曼德 无定论

世界万物都有一个共同的起源与归宿——“无定”(Apeiron)。万物在时间的推移中诞生、发展并消亡,彼此之间存在着此消彼长的规律。当某一种物质过度扩张(即“不正义”)时,就必须在时间的秩序中受到惩罚并归还(“互相偿补”),从而维持宇宙整体的

世界万物都有一个共同的起源与归宿——“无定”(Apeiron)。万物在时间的推移中诞生、发展并消亡,彼此之间存在着此消彼长的规律。当某一种物质过度扩张(即“不正义”)时,就必须在时间的秩序中受到惩罚并归还(“互相偿补”),从而维持宇宙整体的秩序与和谐。

series: | tags: 泛科学 | published: 2026-05-23T17:32:16.090Z

故事思维

人类更擅长于用故事思考,而不是事实,数学和方程。 内部用事实、数学和方程推理;外部用故事、场景和欲望交付。

人类更擅长于用故事思考,而不是事实,数学和方程。 内部用事实、数学和方程推理;外部用故事、场景和欲望交付。

series: | tags: 引导 | published: 2026-05-23T17:30:51.410Z

有明确示例时任务标准

给agent的明确指令:示例a有个指定的巡视者,巡视者目的就是为了任务朝向示例a发展,建立评价标准分数,如85分-99分,当任务达到99分时,即任务完成。

给agent的明确指令:示例a有个指定的巡视者,巡视者目的就是为了任务朝向示例a发展,建立评价标准分数,如85分-99分,当任务达到99分时,即任务完成。

series: | tags: 策略 | published: 2026-05-23T17:30:51.410Z