我越来越不相信“把所有问题都丢进一个聊天窗口”是一种可靠的知识管理方式。
聊天很适合探索:你可以问一个问题,追问几轮,让 AI 帮你解释一个概念、读一段代码、比较几个方案。但聊天有一个根本问题:它很难沉淀。一次对话里有事实、有推理、有临时判断、有错误、有上下文依赖,也有当时才成立的结论。如果不把这些东西重新组织,它们很快会变成一堆看似有用、实际很难复用的记录。
我想要的不是“更多聊天记录”,而是一套能让 AI 参与长期知识形成的本地系统。
这就是我开始搭 Obsidian + Codex 联邦知识库的原因。
这不是从零发明一个知识库
先把边界说清楚:这套系统不是在发明“AI 知识库”。
公开实践里已经有很多重要线索。Obsidian 证明了本地 Markdown、双向链接和文件夹结构可以长期承载个人知识。PARA、Zettelkasten 等方法证明了知识组织需要持续流动,而不是只靠收藏。Karpathy-style LLM Wiki 把一个 wiki 设计成 AI 可读取、可维护、可执行的工作面。LLM Wikid、SwarmVault、Zettelclaw 这类项目也都在探索让 AI 维护本地 wiki 或 vault。
所以我真正关心的不是“让 AI 读一个 vault”。
我关心的是另一件事:
project evidence -> federation inbox -> central wiki/source draft -> publication candidate -> site artifact
也就是说,项目里的事实、中央库里的长期知识、AI 的编译动作、Obsidian 的人工审阅、网站的公开发布,不能混成一团。已有实践给了我很多材料,但我的问题更具体:当我同时有多个项目、多个隐私级别、多个发布目标时,怎样让 AI 参与知识形成,又不让边界失控?
本地文件比聊天记录更适合作为知识真相源
本地知识库的第一层价值不是酷炫,而是可控。
文件有路径、版本、来源、修改记录和明确的所有权。聊天记录通常只有时间线和上下文片段。文件可以被 Obsidian 阅读,可以被 Git 管理,可以被 Codex 修改,也可以被脚本检查。聊天记录更多是交互过程,不适合作为长期事实层。
所以这套系统的基本判断是:
conversation is working memory
files are durable knowledge
对话可以帮助我思考,但稳定结论必须回到文件。否则每一次讨论都会重新开始,每一个项目都会重新解释背景,每一个新想法都无法和旧材料可靠连接。
为什么不是一个超大的知识库
把所有材料都放进一个 Obsidian vault 看起来简单,但很快会遇到另一个问题:边界消失。
我会在不同项目里做研究、开发产品、整理家庭资料、准备公开文章。它们的隐私级别、事实来源、更新节奏和公开边界都不一样。如果把所有内容都摊平,AI 很容易把项目局部结论当成全局原则,也容易把私有材料误带进公开内容。
所以我采用联邦式结构:
- 中央知识库沉淀长期概念、方法和公开候选内容。
- 项目目录保留项目事实、研究包、代码和局部结论。
- 发布节点只负责把已审查内容渲染成网站页面。
- AI 默认只看当前目录,需要跨边界时走窄接口。
这不是目录洁癖,而是事实治理。
Codex 在这里不是聊天机器人,而是编译器
在这套系统里,Codex 的角色不是陪聊,而是把材料编译成结构化知识。
它可以读取来源,提炼概念,更新专题页,整理索引,生成 publication source draft,也可以检查公开边界。但它不应该随意把项目文档搬进中央库,也不应该在站点目录里临时补写知识来源。
更准确地说,Codex 在不同目录下有不同角色:
- 在中央知识库里,它是 knowledge compiler。
- 在项目目录里,它是 project worker。
- 在发布节点里,它是 rendering and build assistant。
同一个 AI 工具,如果没有目录角色,最后很容易变成“什么都能看、什么都能改、什么都说不清来源”的黑箱。
Obsidian 的价值是让人重新掌控知识
我仍然需要 Obsidian,因为 AI 不是知识库的唯一使用者。
Obsidian 给我的是阅读、链接、反向链接、手动修订和长期浏览能力。它不是用来替代 Codex 的,也不是让 AI 在图谱里自动漫游。它更像是人的知识控制台:我可以看到哪些概念已经稳定,哪些专题还缺证据,哪些输出已经准备公开。
AI 可以加速编译,但人仍然要决定什么值得保留、什么应该删除、什么可以公开、什么只能留在项目里。
这套系统真正解决的是连续性
一个知识系统最难的不是存储,而是连续性。
今天调研的产品,明天可能会变成一个专题。项目里的复盘,几周后可能会抽象成一个概念。一次产品讨论,之后可能会变成公开文章。一个私有仓库里的工程实践,可能会提炼成开源方法论。
聊天记录很难支撑这种连续性。本地联邦知识库可以。
它让每一类内容都有自己的位置:证据、概念、项目事实、公开稿、发布记录、审计边界。更重要的是,它让 AI 知道自己正在处理哪一种内容,而不是在一个无限上下文里自由发挥。
这就是我为什么不把聊天记录当知识库。
我需要的不是一个更聪明的聊天窗口,而是一套能让人、AI、项目和发布长期协作的知识操作系统。
