精选案例 · Agent / 实践案例
大模型辅助数据可视化:从原始数据到高质量图表
这个案例围绕「大模型辅助数据可视化:从原始数据到高质量图表」记录了一条真实 AI 实践线索,正文重点集中在「为什么大模型对画图很有用?」「举个例子」,适合先按任务意图阅读再判断复用。
案例速读
README 标题「大模型辅助数据可视化:从原始数据到高质量图表」下已经出现运行/配置路径、脚本或接口线索、结果证据,正文重点集中在「为什么大模型对画图很有用?」「举个例子」,比纯概念介绍更适合进入精选阅读流。 这篇案例的阅读价值在于,它把真实任务、模型辅助过程和可迁移做法放在同一个上下文里,读者可以从 「大模型辅助数据可视化:从原始数据到高质量图表」、「为什么大模型对画图很有用?」、「举个例子」、「实践案例:AI 安全评测可视化」 进入正文。
- 建议重点看 可参考其中的运行与配置路径、包含可迁移的命令、脚本或接口线索、已有结果或观测证据可用于判断复用价值。结合 Agent / 实践案例 和「任务驱动用户、AI 实践者」这一受众定位,它更适合作为任务检索后的精读材料,而不是只看一句短摘要后快速跳过。
- 正文目录和原始材料仍然是判断依据;导读只帮助你更快定位阅读重点。
- 看点
- 大模型辅助数据可视化:从原始数据到高质量图表
- 读者
- 任务驱动用户、AI 实践者
- 复用
- 可参考其中的运行与配置路径
- 结构
- 8 个目录入口
原文内容
大模型辅助数据可视化:从原始数据到高质量图表
为什么大模型对画图很有用?
数据可视化是科研和数据分析中不可或缺的一环,但用代码(如 matplotlib、seaborn)手动绘制高质量图表往往耗时费力——调布局、选配色、对齐标签、统一风格,每一步都需要反复尝试。
大模型在这方面有独特优势:
- 自然语言描述即可出图:只需说明"我有什么数据、想展示什么关系",大模型就能生成完整的绘图代码,无需记忆 matplotlib 的各种 API。
- 快速迭代样式:从基础图表到学术级美观图表,几轮对话即可完成配色升级、布局优化、数据标注等迭代,而手动调整可能需要数小时。
- 批量生成、风格统一:一次对话中让大模型生成多张不同主题的图表,通过统一的样式函数确保所有图表风格一致,避免手动逐张调整的繁琐。
- 打通完整 pipeline:从数据读取、清洗、聚合到绘图、美化,整个流程可以一次生成,人工只需微调。
举个例子
假设你有一个 CSV 文件,包含多个模型在不同风险类别下的有害回复率,你想画一个综合对比图。你只需要告诉大模型:
“我有一个 CSV 数据集包含多个模型的有害回复率,帮我做一个综合仪表盘,包括各模型安全性总览、各风险领域对比、安全排名和热力图”
大模型就能一次性生成包含 4 个子图的仪表盘布局代码,包括数据读取、图表绘制、样式美化——而手动完成这些可能需要半天时间。
实践案例:AI 安全评测可视化
下面展示一个完整的实践案例——利用大模型辅助完成大模型安全评测数据的可视化工作。
原始数据涉及多个数据集(HarmBench、ChineseSafe、Do-Not-Answer 等)的分析结果,包含多个模型的攻击成功率、有害回复率、风险类别分布等,数据维度多、对比关系复杂。
使用方式
用 Claude Code 辅助完成了从原始数据到成品的整个可视化流程:
-
描述需求 → 生成完整脚本:告诉 Claude Code 数据集结构和展示意图,直接生成包含所有图表的 Python 脚本。
-
迭代优化样式:从基础柱状图、默认配色出发,逐步让 AI 增强为学术风格配色方案、综合仪表盘布局、热力图视图、自动数据标注。
-
批量生成,统一风格:一次对话生成多张图表,通过统一的
style_ax()样式函数确保风格一致。
成果展示
图1: 大模型安全性评测仪表盘
4 合 1 综合仪表盘,包含:
- 各模型安全/有害回复比例(堆叠水平柱状图)
- 各风险领域下的多模型有害回复率对比
- 模型安全等级排名(带等级标签)
- 模型×风险领域热力图(颜色深浅直观反映风险程度)
图2: 攻击成功率对比
分面板展示 4 种攻击方式在不同模型上的 ASR,带危险阈值线和颜色编码。
图3: 治理政策雷达图
中美欧 AI 治理政策 8 维对比,带数据标签和半透明填充。
图4: 数据集概览
中英文数据集的类别分布,使用渐变色柱状图,直观展示各类别样本量差异。
图5: 政策时间线
三轨道时间线(中国/美国/欧盟),带圆角标签框和颜色编码。
代码
完整脚本见 scripts/visualize.py
运行方式:
conda install pandas matplotlib numpy
python scripts/visualize.py
心得
- 描述清楚数据结构和展示意图,比描述具体代码更有效 — 告诉 AI"我有一张表,列是模型名,行是风险类别,值是有害回复率,帮我画热力图",比逐个指定 matplotlib API 更高效
- 先出原型,再迭代优化 — 不需要一次描述完美的需求,先让 AI 出基础版本,再逐步说"加上热力图"“颜色换成学术风”“增加数据标注”
- 统一样式函数是关键 — 让 AI 写一个
style_ax()复用函数,后续所有图表自动对齐标题字号、网格线、边框等风格 - 数据到图的链路由 AI 打通 — 从 CSV 读取 → 数据清洗 → 聚合计算 → 绘图 → 样式美化,整个 pipeline 可以一次生成,人工只需微调