8 种背景、8 张幻灯,一个关于如何把 AI 变成「长期记忆外挂」的最短陈述。按 → 继续。
Token 上限是一个物理事实。你每次和 LLM 说话,它都是一个失忆症患者。
而是:把你的知识、偏好、历史都写进文件系统。
让 LLM 每次对话前,先去读那个系统。
把所有东西塞 prompt,贵、慢、最终溢出。
按需加载,永远不溢出,结构化可 diff。
memory: root: ~/.llm-wiki format: markdown retrieval: hybrid # embedding + bm25
你现在拥有一个会随时间增长的 第二大脑。每次对话它都会被读、被更新。
的 re-explain 被消除。平均每次对话节省 4.2 分钟 的 re-context。
不是装又一个插件。是决定:从今晚起,你的所有 AI 对话都要有一个共同的 vault。
$ mkdir ~/llm-wiki && cd ~/llm-wiki $ git init $ echo "# my brain" > README.md
Karpathy 的原始 thread + 我的 vault 结构都在 github.com/lewis/llm-wiki。欢迎按 ← 再看一遍。