精选案例 · Agent / 实践案例
个人记忆系统构建与 AI 辅助开发实践
可读标题 · 基于原文内容整理
原题:胡英实PB24000089
这个案例围绕「胡英实PB24000089」记录了一条真实 AI 实践线索,正文重点集中在「我做了一个能记住我的记忆系统」「〇、开场」,适合先按任务意图阅读再判断复用。
案例速读
README 标题「胡英实PB24000089」下已经出现运行/配置路径、脚本或接口线索、结果证据,正文重点集中在「我做了一个能记住我的记忆系统」「〇、开场」,比纯概念介绍更适合进入精选阅读流。 这篇案例的阅读价值在于,它把真实任务、模型辅助过程和可迁移做法放在同一个上下文里,读者可以从 「胡英实PB24000089」、「我做了一个能记住我的记忆系统」、「〇、开场」、「一、问题是什么」 进入正文。
- 建议重点看 可参考其中的运行与配置路径、包含可迁移的命令、脚本或接口线索、已有结果或观测证据可用于判断复用价值。结合 Agent / 实践案例 和「任务驱动用户、AI 实践者」这一受众定位,它更适合作为任务检索后的精读材料,而不是只看一句短摘要后快速跳过。
- 正文目录和原始材料仍然是判断依据;导读只帮助你更快定位阅读重点。
- 看点
- 胡英实PB24000089
- 读者
- 任务驱动用户、AI 实践者
- 复用
- 可参考其中的运行与配置路径
- 结构
- 9 个目录入口
原文内容
胡英实PB24000089
我做了一个能记住我的记忆系统
作者:胡英实,少年班学院 24 级,物理系本科生 配套开源:github.com/labazhou2024/memexa ·
pip install memexa
〇、开场
半夜两点,我问 ChatGPT 一件事:上周谁在群里跟我聊过 X。
它给了一个名字。一个具体的人名。
我心里一惊。我从没告诉过它任何关于 X 的事。它在编。
我把同一句问题转给 Claude。Claude 没编。它礼貌地说没有访问我聊天记录的权限。
我打开微信搜索框。要搜,得先想出至少一个关键词。我想不出。
那一刻我意识到:和我自己生活有关的小事,是全世界最强的 AI 都答不出的题。它们不认识我。
一、问题是什么
ChatGPT 不"认识"任何人。每次对话开始它就是金鱼,对话结束它就忘。
Claude 知道得多,但它的"多"是训练语料。维基百科、StackOverflow、推特、新闻。不是我。
我每天产出的痕迹散在 7 个地方:微信、QQ、邮件、浏览器、Claude 对话、录音笔、电脑里的文档。它们彼此孤立。没有任何一款现成的 AI 助手能跨过这些边界。
我想要的助手只做一件事:把这些痕迹连起来读懂,让我用一句自然话查。
最朴素的 4 类问题:
- 上周谁跟我说过 X
- 我和 L 是怎么认识的
- 这个月我答应过别人哪些事
- 那个项目从哪天开始卡住的
不需要 AGI。这些问题要的不是更聪明的 AI,是记忆。
我尝试过现成方案。
把所有聊天记录导出成文本灌进 ChatGPT,第一天就崩。一是隐私——把全部微信扔给云端,我不敢。二是颗粒度——大模型读 5000 条群消息能记住的有限,关键细节被稀释。
试过几个商业知识库工具。它们要我手动打标签、画 schema、对齐实体。维护成本超过我的耐心。我是物理系学生,不是产品经理。
剩下的路只有一条:让 AI 自己读懂这些痕迹,自己整理,自己建索引。
二、它长什么样
四个月时间,我和 Claude Code 一起做了一个东西。
它每天定时跑,从 7 类来源抓我的当日痕迹。每条痕迹走 4 步:
- 先判断——这条值不值得记下来
- 读懂内容——提取人、时间、动作、对象
- 交叉验证——去重、消歧、关联已有实体
- 入库——建语义索引
截至今天(2026-05-19 17:13 北京时间),系统里累计 14,725 张事件卡片,490,665 条关联。每张卡片记一件事:谁、什么时候、对谁、说了什么、做了什么决定。
它分布跑在三台机器:我笔记本、家里那台 Mac、学校的 GPU 服务器。任一台停电,6 小时内自愈。
三、和 agent 联动——Claude Code 不再问我"你是谁"
光有记忆图谱不够。它真正的力量在 Claude Code 调度专门 agent 时显现。
我的 .claude/agents/ 目录下有 35 个专门 agent。每个负责一类事。它们都接同一个记忆系统,不需要重复问我是谁。
下面 4 个真实场景,从我每周都在用的工作流里挑出来。
场景 1 · 补一份大物实验报告
我说一句话:
帮我补一份大物实验 N 的预习报告,截止本周日。
Claude Code 调起 physics-lab-report agent。它做了 6 件事:
- 从待办系统拉出补做窗口 + 助教邮件里"需要数据表格"那条要求
- 拿到我的姓名 / 学号 / 班级 / 院系
- 找出我前 12 份大物报告的 LaTeX 封面模板
- 知道我用 xelatex、章节标题不带英文括号、不写致谢
- 写正文 + 渲染 + 校对
- 输出 PDF + 一页"明天要做什么"行动卡
整个过程 20 分钟。我做的只是审稿 + 发邮件。
如果没有这套系统,每一步都要登录一个不同的网站。学号填错一位、模板版本搞混、助教要求忘了——每一项都翻车过。
场景 2 · 见导师前 brief 一份
我说一句话:
我明天上午要去 X 老师办公室一趟,给我准备一下。
Claude Code 调起 briefing agent。它从记忆系统跨 4 类来源捞:
- 最近 3 个月我和这位老师聊过的所有主题
- 上次他/她提过的要求,我答应了什么,回了没
- 当前我手里这位老师相关的项目处于哪一步
- 邮件里他/她最近问过的具体问题
合成一页 brief。我去办公室前 5 分钟扫一眼,心里有数。
不再有"老师问起 X,我记不清上次聊到哪了"这种尴尬。
场景 3 · 本月项目周报
我说一句话:
给我做一份本月研究周报,简版。
Claude Code 调起 research-assistant agent。跨源合稿:
- 我这个月 git 仓库的 commit 主题
- 关键聊天里的方向决策点
- 邮件里收到的 review 与反馈
- 录音笔里组会讨论的关键句
每一条都附原始来源时间戳,让我能回溯证据。
不用我自己翻 4 个不同的地方再拼接。
场景 4 · 发一条难措辞的消息
我说一句话:
我要回 X 老师那条催稿邮件,但又不想显得太赶,帮我写一下。
Claude Code 调起 style-messenger agent。它从记忆里读:
- 我和这位老师过去的交流语气
- 哪些表达方式我以前用过、对方接受过
- 当前这个稿子真实的进度位置
输出 3 个语气候选给我挑:A 简短承诺 / B 详细说明进度 / C 提出延后请求。
我挑一个,微调,发送。
这背后是同一个模式
4 个场景,4 个 agent,1 个共同底座:记忆图谱。
每个 agent 都不需要我重复说"我是谁、我在做什么、我的偏好"。它们直接从记忆里拿。
Claude Code 干的事:找对的 agent + 找对的查询路径。
我干的事:说一句话。
这种"不用解释"是稀缺的体验。这才是四个月做这件事的真正回报。
四、关于隐私
整套系统跑在我自己的电脑里。
数据不出本地。LLM 调用走学校提供的 USTC LiteLLM API,对应数据流是"我的文本 → 学校 API → 解析结果回来",不出 USTC 校园网。
主系统不开源——里面是我真实的聊天、邮件、录音。但系统的核心机制脱敏后已抽出来发到 PyPI,叫做 Memexa。它接 Claude Code 的方式跟我自己的系统一样。一行装:
pip install memexa
memexa demo
任何同学都可以拿去给自己用。不限于物理系,不限于本科生,不限于会编程的人。(项目还处在很早期阶段,欢迎一起共建)
五、做了四个月,我学到什么
这四个月让我相信一件事:
你不需要精通编程,才能让 AI 记得住你。
你需要的只是把"我想要的是什么"说清楚。剩下的事,Claude Code 会帮你干完。
我是物理系本科生,没受过工程训练。这件事开始的时候我完全不知道怎么做。
四个月后系统里有了 14,725 张卡片。每天它还在自己长。
致谢
- 感谢 USTC LiteLLM API 通道提供生产 LLM 后端
- 感谢 Claude Code 陪我走过的每一段路
- 感谢「词元计划」给的这个分享空间