精选案例 · 知识库与文档 / Agent 自动化

写给大家看的 Agent 入门指南

作者： amos

面向USTC Token Plan成长营的Agent入门指南，强调按任务选择工具链+模型+工作方式，提供USTC可用模型列表、难度组合矩阵、四种典型任务建议（终端脚本、仓库修改、报告长文档、复杂项目多Agent分工）以及新手一周分步练习计划，最后给出选型原则和可复用工作流模板。

案例速读

README提供了USTC Token Plan真实可用的模型列表（包括deepseek-v4-flash-ascend、qwen3.6系列等）和明确的任务难度组合矩阵，按终端协作、仓库修改、报告长文档、复杂项目四种场景分别给出具体推荐工具链和模型，并包含新手7天分步骤练习计划和6步工作流模板。内容基于实际使用经验，选型原则和风险提示（如报告需人工复核事实）实用性强，适合直接作为词元计划参与者上手Agent的参考资料。建议从「写给大家看的 Agent 入门指南」、「先把模型来源说清楚」、「一张组合矩阵」、「按任务选，而不是按名气选」进入正文，先确认真实任务和模型辅助过程。

重点看 USTC Token Plan模型与商业模型组合矩阵、四类典型任务的推荐工具链与模型、新手一周练习路线（终端协作→真实仓库→长上下文→固定工作流）。结合知识库与文档 / Agent 自动化 / Agent入门 / 模型选型和「USTC Token Plan参与者、AI初学者、开发者」，它更适合作为任务检索后的精读材料。
正文目录和原始材料仍然是判断依据；导读只帮助你更快定位阅读重点。

首读入口: 先把模型来源说清楚
读者: USTC Token Plan参与者、AI初学者、开发者
复用: USTC Token Plan模型与商业模型组合矩阵
结构: 12 个目录入口

原文内容

写给大家看的 Agent 入门指南

面向 USTC Token Plan / 词元计划成长营。
这篇不是官方文档，也不是模型排名。它更像是一份我自己折腾 Agent 之后整理出来的上手路线。

版本：20260519

很多同学第一次接触 Agent 工具链时，会直接问一个问题：

到底哪个模型最好？

我现在更想先问另一个问题：

你要完成的任务是什么？你手里的模型从哪里来？你的工具链能不能真的接上？

因为 Agent 不是单纯的大模型聊天。

它至少包含三层东西：

模型，负责理解、推理、生成；
Agent 工具链，负责读文件、改代码、跑命令、调用外部工具；
人，负责目标定义、边界控制、验收和最终决策。

只比较模型强弱，很容易把事情想简单。

真正有用的选型方式，是按任务来选 工具链 + 模型 + 工作方式。

先把模型来源说清楚

这块一定要讲清楚。

词元计划支持的模型，和你自己另外订阅的商业模型，不是一回事。

我本地此前记录到的 USTC Token Plan 可调用模型包括：

deepseek-v4-flash-ascend
deepseek-v4-pro
qwen-chat
qwen-reasoner
qwen3.6-chat
qwen3.6-reasoner
smart/default
smart/reasoning

但模型列表可能会调整。

所以实际使用时，还是要以当前账号调用 /v1/models 的返回结果为准。

另一边，GPT 5.x、Claude 4.x 这类商业模型，通常需要自己解决账号、订阅或 API Key。它们不应该被默认写成词元计划直接提供的模型。

我后面会把它们放进矩阵，是因为很多 Agent 工具链原生适配这些模型，适合作为进阶路线和能力对照。

一张组合矩阵

上手难度	工具链组合	模型来源	推荐模型	适合任务
低	DeepSeek-TUI + USTC DeepSeek 系列	词元计划内可用，需 `/v1/models` 实测确认	`deepseek-v4-flash-ascend`、`deepseek-v4-pro`	终端问答、命令解释、小脚本、中文技术讨论
低到中	OpenAI-compatible 客户端 + USTC Qwen/Smart 系列	词元计划内可用，需 `/v1/models` 实测确认	`qwen3.6-chat`、`qwen3.6-reasoner`、`smart/default`、`smart/reasoning`	中文规划、报告整理、API 验证、批处理脚本
中	Codex + GPT 5.x	通常需要自行解决	GPT 5.x / Codex 系列模型	真实代码库修改、多文件任务、测试验证、前后端联调
中到高	Claude Code + Claude 4.x	通常需要自行解决	Claude 4.x 系列	长上下文理解、架构梳理、代码审查、复杂文档整理
中到高	兼容 Agent + USTC reasoner 系列	部分可用，工具适配需验证	`qwen3.6-reasoner`、`smart/reasoning`	方案拆解、中文推理、报告、规划、代码审查辅助
高	多 Agent 混用	混合来源	词元计划模型 + 自备商业模型	开源项目、复杂产品原型、压测工具、文档和验收交叉验证

这里有个很现实的判断。

低门槛任务，不要一上来就用最重的工具链。

解释命令、写小脚本、整理日志，用词元计划里的模型就已经很适合练手。

但如果你要改一个真实仓库，要让 Agent 读文件、改文件、跑测试、回报改动，那就应该优先考虑 Codex、Claude Code 这类真正为代码库工作设计的工具。

按任务选，而不是按名气选

1. 只是想跑命令、解释报错、写小脚本

先从低门槛组合开始就好。

2. 要改一个真实代码仓库

这时候就不要只靠聊天窗口复制粘贴了。

3. 要写报告、复盘、长文档

4. 要做复杂开源项目或产品原型

这时候最有效的方式，往往不是让一个模型从头写到尾。

而是 多 Agent 分工。

比如：

一个 Agent 负责需求拆解；
一个 Agent 负责架构；
一个 Agent 负责前端体验；
一个 Agent 负责脚本和自动化；
一个 Agent 负责文档和验收。

词元计划内模型可以承担高频规划、中文整理、局部代码建议和报告草稿。

自备 GPT / Claude 模型可以承担复杂代码库执行、长上下文审查和关键任务。

人负责产品判断、取舍、验收和最终发布。

我觉得多 Agent 最容易被误解成「开很多窗口」。

其实不是。

多 Agent 的价值在分工和交叉验证，不在数量本身。

新手一周上手路线

第一天，先做终端协作

目标不是写大项目。

目标是熟悉「把一个小任务交给 Agent」的感觉。

可以让 Agent：

解释一个命令；
写一个小脚本；
根据报错给排查步骤；
把手工流程整理成 checklist。

推荐组合：

DeepSeek-TUI + USTC DeepSeek 系列；
OpenAI-compatible 客户端 + USTC Qwen/Smart 系列。

第二到三天，进入真实仓库

找一个小仓库，让 Agent 做一个明确修改。

比如：

改 README；
增加一个脚本；
修一个简单 bug；
写一个最小测试；
把运行步骤自动化。

推荐组合：

Codex + GPT 5.x；
Claude Code + Claude 4.x；
USTC reasoner 系列做方案拆解或代码审查辅助。

第四到五天，练习长上下文理解

不要急着让 Agent 改代码。

先让它读项目、画结构、找风险。

比如：

总结项目结构；
解释配置文件；
找出主要入口；
判断一个功能应该改哪些文件；
生成一份动手前设计说明。

复杂项目里，读懂比写快更重要。

第六到七天，固定自己的工作流

我建议新手先用这个模板：

1. 先让 Agent 读项目，不急着改；
2. 要求 Agent 说明计划和风险；
3. 让 Agent 只改明确范围内的文件；
4. 每次修改后运行验证命令；
5. 让 Agent 汇报改动、测试结果、剩余风险；
6. 重要结果再用另一个模型复核一遍。

这个模板不高级，但很实用。

新手最容易出问题的地方，往往不是模型不够强，而是任务边界太糊。

几条我自己的选型原则

成本敏感、高频小任务，优先使用词元计划内模型。终端问答、小脚本、中文总结、普通规划，不一定需要昂贵商业模型。
复杂代码库、多文件修改，优先使用成熟代码 Agent。模型能力、工具调用、文件编辑、测试执行和上下文管理都很重要。
中文表达、报告、复盘，优先选中文稳定、结构化输出好的模型。这个时候，写得清楚和结论不过度外推，比跑分更重要。
长上下文架构理解，优先选解释稳定、上下文能力强的模型。复杂项目里，先读懂，再动手。
需要对外提交的结果，一定要人工复核。Agent 可以帮你写，但不能替你承担事实准确性、发布边界和工程后果。

最后

词元计划的价值，不只是让大家多了几个模型可以调用。

更重要的是，它降低了大家 反复试错、比较模型、整理报告、调试脚本、验证工具链 的成本。

真正值得练习的，不是「让 AI 替我完成一切」。

而是学会在不同任务下选择合适的模型和 Agent 框架，把 AI 放进一个 可控、可复核、可持续 的工程流程里。

如果你刚开始玩 Agent，我的建议很简单：

先从一个小任务开始。

不要一上来就追求最强模型、最复杂框架、最长上下文。

先让 Agent 帮你解释一个报错，写一个脚本，改一个 README。

然后慢慢进入真实仓库，进入长任务，进入多 Agent 协作。

一周以后，你大概率就会发现，Agent 不是一个神奇按钮。

它更像是一套新的工作习惯。

而这套习惯，越早练，越赚。

返回顶部