1 成对数据
绘图类型 | 名称 | 说明 | 图例 |
plot(x, y) | 折线图 | 折线图适用于需要展示数据趋势、比较多个数据系列、显示周期性变化、强调关键点或分析相关性的场合。 | |
scatter(x, y) | 散点图 | 散点图适用于需要显示变量之间关系、比较多个数据组、发现异常值、显示聚类模式或可视化多维数据的场合。 | |
bar(x, height) | 柱形图 | 柱状图适用于需要比较多个类别数据、显示数据分布、展示排名或排序、显示时间序列数据或可视化频数或比例的场合。 | |
stem(x, y) | 茎叶图 | 茎叶图适用于需要展示数据分布、可视化小型数据集、发现异常值、比较多个数据集,以及用于教学和学习统计学的场合。 | |
fill_between(x, y1, y2) | 区域填充图 | 区域填充图适用于需要表示数据范围、显示误差或置信区间、比较两个数据序列、可视化时间序列数据,以及强调特定区域或事件的场合。 | |
stackplot(x, y) | 区域堆叠图 | 堆叠区域图适用于需要展示多个类别数据的总体趋势、比较类别数据的组成部分、可视化时间序列数据的变化趋势、展示数据的累积效果,以及比较数据的分布或趋势之间的差异的场合。 | |
stairs(values) | 阶梯图 | 阶梯图是一种特殊的线图,它将数据点之间的连线替换为阶梯状的线条,以更好地显示数据的变化情况。 |
2 统计分布
绘图类型 | 名称 | 说明 | 图例 |
hist(x) | 直方图 | 直方图适用于需要进行数据分布分析、数据探索和异常值发现、数据比较和对比、数据预处理和特征工程,以及可视化统计分析结果的场景。 | |
boxplot(X) | 箱线图 | 箱线图适用于需要比较数据分布、发现异常值、展示描述统计量、观察数据分布的偏斜性,以及可视化离散数据的分布情况的场景。 | |
errorbar(x, y, yerr, xerr) | 误差棒 | 误差棒适用于需要表示数据的不确定性、比较多个数据组之间的差异、可视化统计分析结果、展示实验或测量误差,以及可视化时间序列数据的波动性的场景。 | |
violinplot(D) | 小提琴图 | 小提琴图适用于需要比较数据分布、观察数据分布的偏斜性、多变量数据可视化、可视化密度估计,以及识别数据异常值的场景。 | |
eventplot(D) | 事件展示图 | Eventplot图适用于需要展示事件发生的时间、比较多个事件序列、可视化数据的稀疏性,以及数据的变化和趋势分析的场景。 | |
hist2d(x, y) | 二维直方图 | 二位直方图于可视化两个连续变量之间的分布情况。通过将数据点在二维空间中划分为多个小方块(bin),并统计每个方块中的数据点数量,可以直观地显示数据的密度和分布情况。 | |
hexbin(x, y, C) | 六边形密度图 | 六边形密度图适用于处理大量的散点数据,特别是在二维平面上。它提供了一种有效的方式来可视化和分析大规模数据集,帮助发现数据的分布和相关性特征。 | |
pie(x) | 饼状图 | 饼状图可以用于可视化各个部分在整体中的占比关系。它能够直观地展示不同部分的相对大小,并帮助观察者快速了解各个部分所占比例。 | |
ecdf(x) | 经验累计密度函数 | 经验累计密度函数图适用于需要可视化数据分布、比较多个数据集、分位数估计和置信区间展示、异常值识别,以及模型拟合和检验的场景。它不依赖于数据的概率分布假设,而是直接基于实际数据点的累积百分比。 |
matplotlib可以绘制更多类型的图,如3D图,网格图等,这些图往往是适合更专业的领域,暂不涉及;以上的图表类型已经覆盖大多数数据分析及可视化的应用场景;具体的使用方法,在后续文章中再进一步详解;