精选案例 · Agent / 实践案例
Fault Agent
这个案例围绕「Fault Agent」记录了一条真实 AI 实践线索,正文重点集中在「项目简介」「使用对象」,适合先按任务意图阅读再判断复用。
案例速读
README 标题「Fault Agent」下已经出现运行/配置路径、脚本或接口线索、结果证据,正文重点集中在「项目简介」「使用对象」,比纯概念介绍更适合进入精选阅读流。 这篇案例的阅读价值在于,它把真实任务、模型辅助过程和可迁移做法放在同一个上下文里,读者可以从 「Fault Agent」、「项目简介」、「使用对象」、「开发简介」 进入正文。
- 建议重点看 可参考其中的运行与配置路径、包含可迁移的命令、脚本或接口线索、已有结果或观测证据可用于判断复用价值。结合 Agent / 实践案例 和「任务驱动用户、AI 实践者」这一受众定位,它更适合作为任务检索后的精读材料,而不是只看一句短摘要后快速跳过。
- 正文目录和原始材料仍然是判断依据;导读只帮助你更快定位阅读重点。
- 看点
- Fault Agent
- 读者
- 任务驱动用户、AI 实践者
- 复用
- 可参考其中的运行与配置路径
- 结构
- 5 个目录入口
原文内容
Fault Agent
项目简介
Linux 主机故障监控 Agent,定期检查系统故障状态并上报到集中服务器。零外部依赖,单文件部署。数据上报到 https://noc.ustc.edu.cn 后可集中查看各主机的运行状态。
项目地址:https://git.ustc.edu.cn/ustcnic/fault-agent
使用对象
- Linux 服务器运维人员
- 需要集中监控多台主机健康状态的团队
开发简介
- 语言:Python
- 依赖:仅使用 Python 标准库,零外部依赖(可选 pyyaml)
- 配置文件格式:支持 JSON 和 YAML 两种格式
- 核心功能:
- 监控项:内核错误消息、僵尸进程、systemd 单元失效、磁盘/内存/CPU 异常等22项
- 配置热加载
- 支持分组标签(group)和访问控制(GID)
- 支持 --oneshot 单次运行调试模式
- 部署方式:
git clone到目标服务器,配置 crontab 定期执行 - AI 使用:项目由 AI 辅助生成前后端代码