返回案例库

精选案例 · Agent / 实践案例

个人记忆系统构建与 AI 辅助开发实践

可读标题 · 基于原文内容整理

原题:胡英实PB24000089

这个案例围绕「胡英实PB24000089」记录了一条真实 AI 实践线索,正文重点集中在「我做了一个能记住我的记忆系统」「〇、开场」,适合先按任务意图阅读再判断复用。

案例速读

README 标题「胡英实PB24000089」下已经出现运行/配置路径、脚本或接口线索、结果证据,正文重点集中在「我做了一个能记住我的记忆系统」「〇、开场」,比纯概念介绍更适合进入精选阅读流。 这篇案例的阅读价值在于,它把真实任务、模型辅助过程和可迁移做法放在同一个上下文里,读者可以从 「胡英实PB24000089」、「我做了一个能记住我的记忆系统」、「〇、开场」、「一、问题是什么」 进入正文。

  • 建议重点看 可参考其中的运行与配置路径、包含可迁移的命令、脚本或接口线索、已有结果或观测证据可用于判断复用价值。结合 Agent / 实践案例 和「任务驱动用户、AI 实践者」这一受众定位,它更适合作为任务检索后的精读材料,而不是只看一句短摘要后快速跳过。
  • 正文目录和原始材料仍然是判断依据;导读只帮助你更快定位阅读重点。
看点
胡英实PB24000089
读者
任务驱动用户、AI 实践者
复用
可参考其中的运行与配置路径
结构
9 个目录入口

原文内容

胡英实PB24000089

我做了一个能记住我的记忆系统

作者:胡英实,少年班学院 24 级,物理系本科生 配套开源:github.com/labazhou2024/memexa · pip install memexa


〇、开场

半夜两点,我问 ChatGPT 一件事:上周谁在群里跟我聊过 X。

它给了一个名字。一个具体的人名。

我心里一惊。我从没告诉过它任何关于 X 的事。它在编。

我把同一句问题转给 Claude。Claude 没编。它礼貌地说没有访问我聊天记录的权限。

我打开微信搜索框。要搜,得先想出至少一个关键词。我想不出。

那一刻我意识到:和我自己生活有关的小事,是全世界最强的 AI 都答不出的题。它们不认识我


一、问题是什么

ChatGPT 不"认识"任何人。每次对话开始它就是金鱼,对话结束它就忘。

Claude 知道得多,但它的"多"是训练语料。维基百科、StackOverflow、推特、新闻。不是我。

我每天产出的痕迹散在 7 个地方:微信、QQ、邮件、浏览器、Claude 对话、录音笔、电脑里的文档。它们彼此孤立。没有任何一款现成的 AI 助手能跨过这些边界。

我想要的助手只做一件事:把这些痕迹连起来读懂,让我用一句自然话查。

最朴素的 4 类问题:

  1. 上周谁跟我说过 X
  2. 我和 L 是怎么认识的
  3. 这个月我答应过别人哪些事
  4. 那个项目从哪天开始卡住的

不需要 AGI。这些问题要的不是更聪明的 AI,是记忆

我尝试过现成方案。

把所有聊天记录导出成文本灌进 ChatGPT,第一天就崩。一是隐私——把全部微信扔给云端,我不敢。二是颗粒度——大模型读 5000 条群消息能记住的有限,关键细节被稀释。

试过几个商业知识库工具。它们要我手动打标签、画 schema、对齐实体。维护成本超过我的耐心。我是物理系学生,不是产品经理。

剩下的路只有一条:让 AI 自己读懂这些痕迹,自己整理,自己建索引


二、它长什么样

四个月时间,我和 Claude Code 一起做了一个东西。

它每天定时跑,从 7 类来源抓我的当日痕迹。每条痕迹走 4 步:

  1. 先判断——这条值不值得记下来
  2. 读懂内容——提取人、时间、动作、对象
  3. 交叉验证——去重、消歧、关联已有实体
  4. 入库——建语义索引

系统架构

截至今天(2026-05-19 17:13 北京时间),系统里累计 14,725 张事件卡片,490,665 条关联。每张卡片记一件事:谁、什么时候、对谁、说了什么、做了什么决定。

它分布跑在三台机器:我笔记本、家里那台 Mac、学校的 GPU 服务器。任一台停电,6 小时内自愈。


三、和 agent 联动——Claude Code 不再问我"你是谁"

光有记忆图谱不够。它真正的力量在 Claude Code 调度专门 agent 时显现。

我的 .claude/agents/ 目录下有 35 个专门 agent。每个负责一类事。它们都接同一个记忆系统,不需要重复问我是谁。

下面 4 个真实场景,从我每周都在用的工作流里挑出来。


场景 1 · 补一份大物实验报告

我说一句话:

帮我补一份大物实验 N 的预习报告,截止本周日。

Claude Code 调起 physics-lab-report agent。它做了 6 件事:

  1. 从待办系统拉出补做窗口 + 助教邮件里"需要数据表格"那条要求
  2. 拿到我的姓名 / 学号 / 班级 / 院系
  3. 找出我前 12 份大物报告的 LaTeX 封面模板
  4. 知道我用 xelatex、章节标题不带英文括号、不写致谢
  5. 写正文 + 渲染 + 校对
  6. 输出 PDF + 一页"明天要做什么"行动卡

整个过程 20 分钟。我做的只是审稿 + 发邮件。

如果没有这套系统,每一步都要登录一个不同的网站。学号填错一位、模板版本搞混、助教要求忘了——每一项都翻车过。


场景 2 · 见导师前 brief 一份

我说一句话:

我明天上午要去 X 老师办公室一趟,给我准备一下。

Claude Code 调起 briefing agent。它从记忆系统跨 4 类来源捞:

  • 最近 3 个月我和这位老师聊过的所有主题
  • 上次他/她提过的要求,我答应了什么,回了没
  • 当前我手里这位老师相关的项目处于哪一步
  • 邮件里他/她最近问过的具体问题

合成一页 brief。我去办公室前 5 分钟扫一眼,心里有数。

不再有"老师问起 X,我记不清上次聊到哪了"这种尴尬。


场景 3 · 本月项目周报

我说一句话:

给我做一份本月研究周报,简版。

Claude Code 调起 research-assistant agent。跨源合稿:

  • 我这个月 git 仓库的 commit 主题
  • 关键聊天里的方向决策点
  • 邮件里收到的 review 与反馈
  • 录音笔里组会讨论的关键句

每一条都附原始来源时间戳,让我能回溯证据。

不用我自己翻 4 个不同的地方再拼接。


场景 4 · 发一条难措辞的消息

我说一句话:

我要回 X 老师那条催稿邮件,但又不想显得太赶,帮我写一下。

Claude Code 调起 style-messenger agent。它从记忆里读:

  • 我和这位老师过去的交流语气
  • 哪些表达方式我以前用过、对方接受过
  • 当前这个稿子真实的进度位置

输出 3 个语气候选给我挑:A 简短承诺 / B 详细说明进度 / C 提出延后请求。

我挑一个,微调,发送。


这背后是同一个模式

4 个场景,4 个 agent,1 个共同底座:记忆图谱

每个 agent 都不需要我重复说"我是谁、我在做什么、我的偏好"。它们直接从记忆里拿。

Claude Code 干的事:找对的 agent + 找对的查询路径

我干的事:说一句话

这种"不用解释"是稀缺的体验。这才是四个月做这件事的真正回报。


四、关于隐私

整套系统跑在我自己的电脑里。

数据不出本地。LLM 调用走学校提供的 USTC LiteLLM API,对应数据流是"我的文本 → 学校 API → 解析结果回来",不出 USTC 校园网。

主系统不开源——里面是我真实的聊天、邮件、录音。但系统的核心机制脱敏后已抽出来发到 PyPI,叫做 Memexa。它接 Claude Code 的方式跟我自己的系统一样。一行装:

pip install memexa
memexa demo

任何同学都可以拿去给自己用。不限于物理系,不限于本科生,不限于会编程的人。(项目还处在很早期阶段,欢迎一起共建)


五、做了四个月,我学到什么

这四个月让我相信一件事:

你不需要精通编程,才能让 AI 记得住你

你需要的只是把"我想要的是什么"说清楚。剩下的事,Claude Code 会帮你干完。

我是物理系本科生,没受过工程训练。这件事开始的时候我完全不知道怎么做。

四个月后系统里有了 14,725 张卡片。每天它还在自己长。


致谢

  • 感谢 USTC LiteLLM API 通道提供生产 LLM 后端
  • 感谢 Claude Code 陪我走过的每一段路
  • 感谢「词元计划」给的这个分享空间

返回顶部