精选案例 · Agent 自动化 / 科研阅读与计算

个人记忆系统构建与 AI 辅助开发实践

标题由 AI 辅助整理

原题：胡英实PB24000089

中国科学技术大学物理系本科生胡英实为解决个人记忆碎片化问题，利用Claude Code在四个月内开发了一套本地运行的AI记忆系统，跨7个来源提取事件卡片并建语义索引，支持自然语言查询，已积累14725张事件卡片；配合35个专用agent实现自动补实验报告、见导师前简报、项目周报、难措辞消息撰写等场景；核心机制抽象为开源工具Memexa。…

案例速读

该项目分享了作者从个人需求出发，结合Claude Code四个月内构建本地记忆系统的完整过程，包含4个真实应用场景展示系统价值，并提供开源工具Memexa鼓励他人复用。案例详细、数据真实、隐私考虑周到，对大学生和技术爱好者有很强的启发性和可复制性。建议从「胡英实PB24000089」、「我做了一个能记住我的记忆系统」、「〇、开场」、「一、问题是什么」进入正文，先确认真实任务和模型辅助过程。

重点看用Claude Code快速原型开发、个人数字记忆的设计模式、本地化AI隐私方案。结合 Agent 自动化 / 科研阅读与计算 / AI记忆系统 / 个人知识管理和「大学生、研究者、AI爱好者」，它更适合作为任务检索后的精读材料。
正文目录和原始材料仍然是判断依据；导读只帮助你更快定位阅读重点。

首读入口: 我做了一个能记住我的记忆系统
读者: 大学生、研究者、AI爱好者
复用: 用Claude Code快速原型开发
结构: 9 个目录入口

原文内容

胡英实PB24000089

我做了一个能记住我的记忆系统

作者：胡英实，少年班学院 24 级，物理系本科生配套开源：github.com/labazhou2024/memexa · pip install memexa

〇、开场

半夜两点，我问 ChatGPT 一件事：上周谁在群里跟我聊过 X。

它给了一个名字。一个具体的人名。

我心里一惊。我从没告诉过它任何关于 X 的事。它在编。

我把同一句问题转给 Claude。Claude 没编。它礼貌地说没有访问我聊天记录的权限。

我打开微信搜索框。要搜，得先想出至少一个关键词。我想不出。

那一刻我意识到：和我自己生活有关的小事，是全世界最强的 AI 都答不出的题。它们不认识我。

一、问题是什么

ChatGPT 不"认识"任何人。每次对话开始它就是金鱼，对话结束它就忘。

Claude 知道得多，但它的"多"是训练语料。维基百科、StackOverflow、推特、新闻。不是我。

我每天产出的痕迹散在 7 个地方：微信、QQ、邮件、浏览器、Claude 对话、录音笔、电脑里的文档。它们彼此孤立。没有任何一款现成的 AI 助手能跨过这些边界。

我想要的助手只做一件事：把这些痕迹连起来读懂，让我用一句自然话查。

最朴素的 4 类问题：

上周谁跟我说过 X
我和 L 是怎么认识的
这个月我答应过别人哪些事
那个项目从哪天开始卡住的

不需要 AGI。这些问题要的不是更聪明的 AI，是记忆。

我尝试过现成方案。

把所有聊天记录导出成文本灌进 ChatGPT，第一天就崩。一是隐私——把全部微信扔给云端，我不敢。二是颗粒度——大模型读 5000 条群消息能记住的有限，关键细节被稀释。

试过几个商业知识库工具。它们要我手动打标签、画 schema、对齐实体。维护成本超过我的耐心。我是物理系学生，不是产品经理。

剩下的路只有一条：让 AI 自己读懂这些痕迹，自己整理，自己建索引。

二、它长什么样

四个月时间，我和 Claude Code 一起做了一个东西。

它每天定时跑，从 7 类来源抓我的当日痕迹。每条痕迹走 4 步：

先判断——这条值不值得记下来
读懂内容——提取人、时间、动作、对象
交叉验证——去重、消歧、关联已有实体
入库——建语义索引

图片暂时无法显示：系统架构

截至今天（2026-05-19 17:13 北京时间），系统里累计 14,725 张事件卡片，490,665 条关联。每张卡片记一件事：谁、什么时候、对谁、说了什么、做了什么决定。

它分布跑在三台机器：我笔记本、家里那台 Mac、学校的 GPU 服务器。任一台停电，6 小时内自愈。

三、和 agent 联动——Claude Code 不再问我"你是谁"

光有记忆图谱不够。它真正的力量在 Claude Code 调度专门 agent 时显现。

我的 .claude/agents/ 目录下有 35 个专门 agent。每个负责一类事。它们都接同一个记忆系统，不需要重复问我是谁。

下面 4 个真实场景，从我每周都在用的工作流里挑出来。

场景 1 · 补一份大物实验报告

我说一句话：

帮我补一份大物实验 N 的预习报告，截止本周日。

Claude Code 调起 physics-lab-report agent。它做了 6 件事：

从待办系统拉出补做窗口 + 助教邮件里"需要数据表格"那条要求
拿到我的姓名 / 学号 / 班级 / 院系
找出我前 12 份大物报告的 LaTeX 封面模板
知道我用 xelatex、章节标题不带英文括号、不写致谢
写正文 + 渲染 + 校对
输出 PDF + 一页"明天要做什么"行动卡

整个过程 20 分钟。我做的只是审稿 + 发邮件。

如果没有这套系统，每一步都要登录一个不同的网站。学号填错一位、模板版本搞混、助教要求忘了——每一项都翻车过。

场景 2 · 见导师前 brief 一份

我说一句话：

我明天上午要去 X 老师办公室一趟，给我准备一下。

Claude Code 调起 briefing agent。它从记忆系统跨 4 类来源捞：

最近 3 个月我和这位老师聊过的所有主题
上次他/她提过的要求，我答应了什么，回了没
当前我手里这位老师相关的项目处于哪一步
邮件里他/她最近问过的具体问题

合成一页 brief。我去办公室前 5 分钟扫一眼，心里有数。

不再有"老师问起 X，我记不清上次聊到哪了"这种尴尬。

场景 3 · 本月项目周报

我说一句话：

给我做一份本月研究周报，简版。

Claude Code 调起 research-assistant agent。跨源合稿：

我这个月 git 仓库的 commit 主题
关键聊天里的方向决策点
邮件里收到的 review 与反馈
录音笔里组会讨论的关键句

每一条都附原始来源时间戳，让我能回溯证据。

不用我自己翻 4 个不同的地方再拼接。

场景 4 · 发一条难措辞的消息

我说一句话：

我要回 X 老师那条催稿邮件，但又不想显得太赶，帮我写一下。

Claude Code 调起 style-messenger agent。它从记忆里读：

我和这位老师过去的交流语气
哪些表达方式我以前用过、对方接受过
当前这个稿子真实的进度位置

输出 3 个语气候选给我挑：A 简短承诺 / B 详细说明进度 / C 提出延后请求。

我挑一个，微调，发送。

这背后是同一个模式

4 个场景，4 个 agent，1 个共同底座：记忆图谱。

每个 agent 都不需要我重复说"我是谁、我在做什么、我的偏好"。它们直接从记忆里拿。

Claude Code 干的事：找对的 agent + 找对的查询路径。

我干的事：说一句话。

这种"不用解释"是稀缺的体验。这才是四个月做这件事的真正回报。

四、关于隐私

整套系统跑在我自己的电脑里。

数据不出本地。LLM 调用走学校提供的 USTC LiteLLM API，对应数据流是"我的文本 → 学校 API → 解析结果回来"，不出 USTC 校园网。

主系统不开源——里面是我真实的聊天、邮件、录音。但系统的核心机制脱敏后已抽出来发到 PyPI，叫做 Memexa。它接 Claude Code 的方式跟我自己的系统一样。一行装：

pip install memexa
memexa demo

任何同学都可以拿去给自己用。不限于物理系，不限于本科生，不限于会编程的人。（项目还处在很早期阶段，欢迎一起共建）

五、做了四个月，我学到什么

这四个月让我相信一件事：

你不需要精通编程，才能让 AI 记得住你。

你需要的只是把"我想要的是什么"说清楚。剩下的事，Claude Code 会帮你干完。

我是物理系本科生，没受过工程训练。这件事开始的时候我完全不知道怎么做。

四个月后系统里有了 14,725 张卡片。每天它还在自己长。

致谢

感谢 USTC LiteLLM API 通道提供生产 LLM 后端
感谢 Claude Code 陪我走过的每一段路
感谢「词元计划」给的这个分享空间

返回顶部