返回案例库

精选案例 · Agent / 实践案例

写给大家看的 Agent 入门指南

这个案例围绕「写给大家看的 Agent 入门指南」记录了一条真实 AI 实践线索,正文重点集中在「先把模型来源说清楚」「一张组合矩阵」,适合先按任务意图阅读再判断复用。

案例速读

README 标题「写给大家看的 Agent 入门指南」下已经出现运行/配置路径、脚本或接口线索、结果证据,正文重点集中在「先把模型来源说清楚」「一张组合矩阵」,比纯概念介绍更适合进入精选阅读流。 这篇案例的阅读价值在于,它把真实任务、模型辅助过程和可迁移做法放在同一个上下文里,读者可以从 「写给大家看的 Agent 入门指南」、「先把模型来源说清楚」、「一张组合矩阵」、「按任务选,而不是按名气选」 进入正文。

  • 建议重点看 可参考其中的运行与配置路径、包含可迁移的命令、脚本或接口线索、已有结果或观测证据可用于判断复用价值。结合 Agent / 实践案例 和「任务驱动用户、AI 实践者」这一受众定位,它更适合作为任务检索后的精读材料,而不是只看一句短摘要后快速跳过。
  • 正文目录和原始材料仍然是判断依据;导读只帮助你更快定位阅读重点。
看点
写给大家看的 Agent 入门指南
读者
任务驱动用户、AI 实践者
复用
可参考其中的运行与配置路径
结构
12 个目录入口

原文内容

写给大家看的 Agent 入门指南

面向 USTC Token Plan / 词元计划成长营。
这篇不是官方文档,也不是模型排名。它更像是一份我自己折腾 Agent 之后整理出来的上手路线。

版本:20260519

很多同学第一次接触 Agent 工具链时,会直接问一个问题:

到底哪个模型最好?

我现在更想先问另一个问题:

你要完成的任务是什么?你手里的模型从哪里来?你的工具链能不能真的接上?

因为 Agent 不是单纯的大模型聊天。

它至少包含三层东西:

  • 模型,负责理解、推理、生成;
  • Agent 工具链,负责读文件、改代码、跑命令、调用外部工具;
  • ,负责目标定义、边界控制、验收和最终决策。

只比较模型强弱,很容易把事情想简单。

真正有用的选型方式,是按任务来选 工具链 + 模型 + 工作方式

先把模型来源说清楚

这块一定要讲清楚。

词元计划支持的模型,和你自己另外订阅的商业模型,不是一回事。

我本地此前记录到的 USTC Token Plan 可调用模型包括:

  • deepseek-v4-flash-ascend
  • deepseek-v4-pro
  • qwen-chat
  • qwen-reasoner
  • qwen3.6-chat
  • qwen3.6-reasoner
  • smart/default
  • smart/reasoning

但模型列表可能会调整。

所以实际使用时,还是要以当前账号调用 /v1/models 的返回结果为准。

另一边,GPT 5.xClaude 4.x 这类商业模型,通常需要自己解决账号、订阅或 API Key。它们不应该被默认写成词元计划直接提供的模型。

我后面会把它们放进矩阵,是因为很多 Agent 工具链原生适配这些模型,适合作为进阶路线和能力对照。

一张组合矩阵

上手难度 工具链组合 模型来源 推荐模型 适合任务
DeepSeek-TUI + USTC DeepSeek 系列 词元计划内可用,需 /v1/models 实测确认 deepseek-v4-flash-ascenddeepseek-v4-pro 终端问答、命令解释、小脚本、中文技术讨论
低到中 OpenAI-compatible 客户端 + USTC Qwen/Smart 系列 词元计划内可用,需 /v1/models 实测确认 qwen3.6-chatqwen3.6-reasonersmart/defaultsmart/reasoning 中文规划、报告整理、API 验证、批处理脚本
Codex + GPT 5.x 通常需要自行解决 GPT 5.x / Codex 系列模型 真实代码库修改、多文件任务、测试验证、前后端联调
中到高 Claude Code + Claude 4.x 通常需要自行解决 Claude 4.x 系列 长上下文理解、架构梳理、代码审查、复杂文档整理
中到高 兼容 Agent + USTC reasoner 系列 部分可用,工具适配需验证 qwen3.6-reasonersmart/reasoning 方案拆解、中文推理、报告、规划、代码审查辅助
多 Agent 混用 混合来源 词元计划模型 + 自备商业模型 开源项目、复杂产品原型、压测工具、文档和验收交叉验证

这里有个很现实的判断。

低门槛任务,不要一上来就用最重的工具链。

解释命令、写小脚本、整理日志,用词元计划里的模型就已经很适合练手。

但如果你要改一个真实仓库,要让 Agent 读文件、改文件、跑测试、回报改动,那就应该优先考虑 Codex、Claude Code 这类真正为代码库工作设计的工具。

按任务选,而不是按名气选

1. 只是想跑命令、解释报错、写小脚本

先从低门槛组合开始就好。

推荐:

  • DeepSeek-TUI + USTC DeepSeek 系列
  • OpenAI-compatible 客户端 + USTC Qwen/Smart 系列

适合练习:

  • 解释一段报错;
  • 写一个 PowerShell 或 Python 小脚本;
  • 把手工步骤整理成命令;
  • 根据日志判断任务有没有真的跑起来。

这类任务的重点不是模型多强,而是你能不能把问题描述清楚,并让每一次调用都有一个明确结果。

2. 要改一个真实代码仓库

这时候就不要只靠聊天窗口复制粘贴了。

推荐:

  • Codex + GPT 5.x
  • Claude Code + Claude 4.x
  • 工具适配允许时,用 USTC qwen3.6-reasonersmart/reasoning 做方案拆解和审查辅助

真实仓库任务里,Agent 要做的不只是回答问题。

它要能:

  • 读项目结构;
  • 理解已有风格;
  • 修改文件;
  • 运行测试;
  • 汇报改动;
  • 避免乱动无关文件。

这就是代码 Agent 和普通聊天窗口的区别。

3. 要写报告、复盘、长文档

推荐:

  • USTC qwen3.6-chat / qwen3.6-reasoner
  • USTC smart/default / smart/reasoning
  • Claude 4.x 或 GPT 5.x 作为进阶选择

这种任务的重点是材料组织,不是炫技。

我一般会先把事实材料整理成一份可分享版本,再让模型帮我生成:

  • 摘要;
  • 指标表;
  • 问题分析;
  • 下一步建议;
  • 面向不同读者的版本。

这里最重要的一点是,报告写得顺,不代表事实就对。

关键数字、模型来源、结论边界,还是要人自己看。

4. 要做复杂开源项目或产品原型

这时候最有效的方式,往往不是让一个模型从头写到尾。

而是 多 Agent 分工

比如:

  • 一个 Agent 负责需求拆解;
  • 一个 Agent 负责架构;
  • 一个 Agent 负责前端体验;
  • 一个 Agent 负责脚本和自动化;
  • 一个 Agent 负责文档和验收。

词元计划内模型可以承担高频规划、中文整理、局部代码建议和报告草稿。

自备 GPT / Claude 模型可以承担复杂代码库执行、长上下文审查和关键任务。

人负责产品判断、取舍、验收和最终发布。

我觉得多 Agent 最容易被误解成「开很多窗口」。

其实不是。

多 Agent 的价值在分工和交叉验证,不在数量本身。

新手一周上手路线

第一天,先做终端协作

目标不是写大项目。

目标是熟悉「把一个小任务交给 Agent」的感觉。

可以让 Agent:

  • 解释一个命令;
  • 写一个小脚本;
  • 根据报错给排查步骤;
  • 把手工流程整理成 checklist。

推荐组合:

  • DeepSeek-TUI + USTC DeepSeek 系列;
  • OpenAI-compatible 客户端 + USTC Qwen/Smart 系列。

第二到三天,进入真实仓库

找一个小仓库,让 Agent 做一个明确修改。

比如:

  • 改 README;
  • 增加一个脚本;
  • 修一个简单 bug;
  • 写一个最小测试;
  • 把运行步骤自动化。

推荐组合:

  • Codex + GPT 5.x;
  • Claude Code + Claude 4.x;
  • USTC reasoner 系列做方案拆解或代码审查辅助。

第四到五天,练习长上下文理解

不要急着让 Agent 改代码。

先让它读项目、画结构、找风险。

比如:

  • 总结项目结构;
  • 解释配置文件;
  • 找出主要入口;
  • 判断一个功能应该改哪些文件;
  • 生成一份动手前设计说明。

复杂项目里,读懂比写快更重要。

第六到七天,固定自己的工作流

我建议新手先用这个模板:

1. 先让 Agent 读项目,不急着改;
2. 要求 Agent 说明计划和风险;
3. 让 Agent 只改明确范围内的文件;
4. 每次修改后运行验证命令;
5. 让 Agent 汇报改动、测试结果、剩余风险;
6. 重要结果再用另一个模型复核一遍。

这个模板不高级,但很实用。

新手最容易出问题的地方,往往不是模型不够强,而是任务边界太糊。

几条我自己的选型原则

  • 成本敏感、高频小任务,优先使用词元计划内模型。终端问答、小脚本、中文总结、普通规划,不一定需要昂贵商业模型。
  • 复杂代码库、多文件修改,优先使用成熟代码 Agent。模型能力、工具调用、文件编辑、测试执行和上下文管理都很重要。
  • 中文表达、报告、复盘,优先选中文稳定、结构化输出好的模型。这个时候,写得清楚和结论不过度外推,比跑分更重要。
  • 长上下文架构理解,优先选解释稳定、上下文能力强的模型。复杂项目里,先读懂,再动手。
  • 需要对外提交的结果,一定要人工复核。Agent 可以帮你写,但不能替你承担事实准确性、发布边界和工程后果。

最后

词元计划的价值,不只是让大家多了几个模型可以调用。

更重要的是,它降低了大家 反复试错、比较模型、整理报告、调试脚本、验证工具链 的成本。

真正值得练习的,不是「让 AI 替我完成一切」。

而是学会在不同任务下选择合适的模型和 Agent 框架,把 AI 放进一个 可控、可复核、可持续 的工程流程里。

如果你刚开始玩 Agent,我的建议很简单:

先从一个小任务开始。

不要一上来就追求最强模型、最复杂框架、最长上下文。

先让 Agent 帮你解释一个报错,写一个脚本,改一个 README。

然后慢慢进入真实仓库,进入长任务,进入多 Agent 协作。

一周以后,你大概率就会发现,Agent 不是一个神奇按钮。

它更像是一套新的工作习惯。

而这套习惯,越早练,越赚。

返回顶部