返回案例库

精选案例 · Agent / 实践案例

Fault Agent

这个案例围绕「Fault Agent」记录了一条真实 AI 实践线索,正文重点集中在「项目简介」「使用对象」,适合先按任务意图阅读再判断复用。

案例速读

README 标题「Fault Agent」下已经出现运行/配置路径、脚本或接口线索、结果证据,正文重点集中在「项目简介」「使用对象」,比纯概念介绍更适合进入精选阅读流。 这篇案例的阅读价值在于,它把真实任务、模型辅助过程和可迁移做法放在同一个上下文里,读者可以从 「Fault Agent」、「项目简介」、「使用对象」、「开发简介」 进入正文。

  • 建议重点看 可参考其中的运行与配置路径、包含可迁移的命令、脚本或接口线索、已有结果或观测证据可用于判断复用价值。结合 Agent / 实践案例 和「任务驱动用户、AI 实践者」这一受众定位,它更适合作为任务检索后的精读材料,而不是只看一句短摘要后快速跳过。
  • 正文目录和原始材料仍然是判断依据;导读只帮助你更快定位阅读重点。
看点
Fault Agent
读者
任务驱动用户、AI 实践者
复用
可参考其中的运行与配置路径
结构
5 个目录入口

原文内容

Fault Agent

项目简介

Linux 主机故障监控 Agent,定期检查系统故障状态并上报到集中服务器。零外部依赖,单文件部署。数据上报到 https://noc.ustc.edu.cn 后可集中查看各主机的运行状态。

项目地址:https://git.ustc.edu.cn/ustcnic/fault-agent

使用对象

  • Linux 服务器运维人员
  • 需要集中监控多台主机健康状态的团队

开发简介

  • 语言:Python
  • 依赖:仅使用 Python 标准库,零外部依赖(可选 pyyaml)
  • 配置文件格式:支持 JSON 和 YAML 两种格式
  • 核心功能
    • 监控项:内核错误消息、僵尸进程、systemd 单元失效、磁盘/内存/CPU 异常等22项
    • 配置热加载
    • 支持分组标签(group)和访问控制(GID)
    • 支持 --oneshot 单次运行调试模式
  • 部署方式git clone 到目标服务器,配置 crontab 定期执行
  • AI 使用:项目由 AI 辅助生成前后端代码

项目截图

运行截图

运行截图

返回顶部