精选案例 · 数据处理与可视化 / 科研阅读与计算

大模型辅助数据可视化：从原始数据到高质量图表

作者： luyang2008

本案例展示了如何利用大模型（Claude Code）辅助数据可视化，从 CSV 数据集生成 AI 安全评测的多张图表，包括安全仪表盘、攻击成功率对比、治理政策雷达图等。通过自然语言描述需求，AI 直接生成完整绘图脚本，并支持快速迭代样式、统一样式函数、打通数据读取到图表输出的完整 pipeline，显著提升可视化效率。

案例速读

案例具体展示了用 Claude Code 从描述需求到生成完整可视化脚本的迭代过程，包含仪表盘、热力图、雷达图等多类型图表，并总结了描述数据结构、统一样式函数、原型迭代等可复用技巧，对数据可视化工作者有直接参考价值。建议从「大模型辅助数据可视化：从原始数据到高质量图表」、「为什么大模型对画图很有用？」、「举个例子」、「实践案例：AI 安全评测可视化」进入正文，先确认真实任务和模型辅助过程。

重点看用自然语言描述数据结构和展示意图，比描述具体代码更高效、先出基础原型，再迭代优化样式（颜色、布局、标注）、编写统一样式函数（如 style_ax()）确保多张图表风格一致。结合数据处理与可视化 / 科研阅读与计算 / 数据可视化 / AI辅助编程和「数据科学家、研究人员、数据分析师」，它更适合作为任务检索后的精读材料。
正文目录和原始材料仍然是判断依据；导读只帮助你更快定位阅读重点。

首读入口: 为什么大模型对画图很有用？
读者: 数据科学家、研究人员、数据分析师
复用: 用自然语言描述数据结构和展示意图，比描述具体代码更高效
结构: 8 个目录入口

原文内容

大模型辅助数据可视化：从原始数据到高质量图表

为什么大模型对画图很有用？

数据可视化是科研和数据分析中不可或缺的一环，但用代码（如 matplotlib、seaborn）手动绘制高质量图表往往耗时费力——调布局、选配色、对齐标签、统一风格，每一步都需要反复尝试。

大模型在这方面有独特优势：

自然语言描述即可出图：只需说明"我有什么数据、想展示什么关系"，大模型就能生成完整的绘图代码，无需记忆 matplotlib 的各种 API。
快速迭代样式：从基础图表到学术级美观图表，几轮对话即可完成配色升级、布局优化、数据标注等迭代，而手动调整可能需要数小时。
批量生成、风格统一：一次对话中让大模型生成多张不同主题的图表，通过统一的样式函数确保所有图表风格一致，避免手动逐张调整的繁琐。
打通完整 pipeline：从数据读取、清洗、聚合到绘图、美化，整个流程可以一次生成，人工只需微调。

举个例子

假设你有一个 CSV 文件，包含多个模型在不同风险类别下的有害回复率，你想画一个综合对比图。你只需要告诉大模型：

“我有一个 CSV 数据集包含多个模型的有害回复率，帮我做一个综合仪表盘，包括各模型安全性总览、各风险领域对比、安全排名和热力图”

大模型就能一次性生成包含 4 个子图的仪表盘布局代码，包括数据读取、图表绘制、样式美化——而手动完成这些可能需要半天时间。

实践案例：AI 安全评测可视化

下面展示一个完整的实践案例——利用大模型辅助完成大模型安全评测数据的可视化工作。

原始数据涉及多个数据集（HarmBench、ChineseSafe、Do-Not-Answer 等）的分析结果，包含多个模型的攻击成功率、有害回复率、风险类别分布等，数据维度多、对比关系复杂。

使用方式

用 Claude Code 辅助完成了从原始数据到成品的整个可视化流程：

描述需求 → 生成完整脚本：告诉 Claude Code 数据集结构和展示意图，直接生成包含所有图表的 Python 脚本。
迭代优化样式：从基础柱状图、默认配色出发，逐步让 AI 增强为学术风格配色方案、综合仪表盘布局、热力图视图、自动数据标注。
批量生成，统一风格：一次对话生成多张图表，通过统一的 style_ax() 样式函数确保风格一致。

成果展示

图1: 大模型安全性评测仪表盘

图片暂时无法显示：仪表盘

4 合 1 综合仪表盘，包含：

各模型安全/有害回复比例（堆叠水平柱状图）
各风险领域下的多模型有害回复率对比
模型安全等级排名（带等级标签）
模型×风险领域热力图（颜色深浅直观反映风险程度）

图2: 攻击成功率对比

图片暂时无法显示：攻击对比

分面板展示 4 种攻击方式在不同模型上的 ASR，带危险阈值线和颜色编码。

图3: 治理政策雷达图

图片暂时无法显示：雷达图

中美欧 AI 治理政策 8 维对比，带数据标签和半透明填充。

图4: 数据集概览

图片暂时无法显示：数据集概览

中英文数据集的类别分布，使用渐变色柱状图，直观展示各类别样本量差异。

图5: 政策时间线

图片暂时无法显示：时间线

三轨道时间线（中国/美国/欧盟），带圆角标签框和颜色编码。

代码

完整脚本见 scripts/visualize.py

运行方式：

conda install pandas matplotlib numpy
python scripts/visualize.py

心得

描述清楚数据结构和展示意图，比描述具体代码更有效 — 告诉 AI"我有一张表，列是模型名，行是风险类别，值是有害回复率，帮我画热力图"，比逐个指定 matplotlib API 更高效
先出原型，再迭代优化 — 不需要一次描述完美的需求，先让 AI 出基础版本，再逐步说"加上热力图"“颜色换成学术风”“增加数据标注”
统一样式函数是关键 — 让 AI 写一个 style_ax() 复用函数，后续所有图表自动对齐标题字号、网格线、边框等风格
数据到图的链路由 AI 打通 — 从 CSV 读取 → 数据清洗 → 聚合计算 → 绘图 → 样式美化，整个 pipeline 可以一次生成，人工只需微调

返回顶部