一文总结各大顶刊中常用的精美论文插图|每日绘图·24-08-12

小罗碎碎念

我相信有一个问题肯定困扰了一大批科研工作者——我的文章需要配哪些图?

又或者我们在看到某一篇文献的时候,只知道配图很精美,但是却不知道这种图的名字,也不知道这种图的类别,更不清楚如何通过代码绘制出这样精美的图。

那么,这篇文章就是为你们量身定制的,我接下来也会每天用一篇推文介绍一种绘图方式,跟上节奏,别掉队哦!!


一、数值变量

1-1:单个数值变量

  • 直方图(Histogram):用于展示数据分布,了解数据的集中趋势和离散程度。
  • 密度图(Density Plot):平滑的曲线图,用于估计数据的概率密度函数,适用于展示连续数据的分布。

1-2:两个数值变量

未排序

  • 箱线图(Box Plot):展示数据的分布情况,包括中位数、四分位数以及异常值。
  • 散点图(Scatter Plot):展示两个变量之间的关系,适用于数据点较少的情况。
  • 小提琴图(Violin Plot):结合了箱线图和密度图的特点,展示数据分布的密度估计。
  • 边际散点图(Scatter with Marginal Point):在散点图的基础上添加边际分布的直方图或密度图,提供更多数据分布信息。
  • 二维密度图(2D Density Plot):展示两个变量的联合分布,了解它们之间的依赖关系。

有序

  • 连接散点图(Connected Scatter Plot):展示两个有序变量之间的关系,通常用于时间序列数据。
  • 区域图(Area Plot):展示数据随时间变化的趋势,适用于展示多个变量随时间的变化。
  • 线图(Line Plot):展示数据随时间或其他有序变量的变化趋势。

1-3:三个数值变量

未排序

  • 箱线图(Box Plot):展示每个变量的分布情况。
  • 小提琴图(Violin Plot):提供更丰富的数据分布信息。
  • 气泡图(Bubble Plot):在散点图的基础上添加第三个维度,通过气泡大小表示第三个变量的值。
  • 三维散点图或表面图(3D Scatter or Surface):在三维空间中展示三个变量的关系。

有序

  • 堆叠区域图(Stacked Area Plot):展示多个变量随时间或其他有序变量的变化趋势。
  • 流线图(Streamgraph):一种可视化随时间变化的多个变量的堆叠区域图的变体,更易于观察变量的增减。
  • 线图(Line Plot):展示一个或多个变量随时间或其他有序变量的变化。

1-4:多个数值变量

未排序

  • 箱线图(Box Plot):展示每个变量的分布情况。
  • 小提琴图(Violin Plot):提供更丰富的数据分布信息。
  • 山脊线图(Ridgeline):一种展示多个分布的叠加图,用于比较不同组或条件下的数据分布。
  • 主成分分析图(PCA):用于降维和可视化高维数据。
  • 相关图(Correlogram):展示变量之间的相关性。
  • 热图(Heatmap):用颜色变化展示变量间的相关性或数据矩阵的值。
  • 树状图(Dendrogram):展示数据的层次结构或聚类结果。

有序(Ordered)

  • 堆叠区域图(Stacked Area Plot):展示多个变量随时间或其他有序变量的变化趋势。
  • 流线图(Streamgraph):展示随时间变化的多个变量的增减情况。
  • 线图(Line Plot):展示一个或多个变量随时间或其他有序变量的变化。
  • 面积图(Area Plot):展示数据随时间变化的趋势,适用于展示多个变量的变化。

这些图表类型选择的依据是数据的特性和研究者希望传达的信息。例如,如果数据是连续的并且研究者希望展示分布特性,直方图或密度图可能是合适的选择。如果研究者希望展示变量之间的关系,散点图或相关图可能更合适。选择正确的图表类型可以帮助更清晰、更有效地传达研究结果。


二、分类变量

在科研绘图中,分类变量(Categorical Variables)的可视化通常用于展示不同类别之间的比较或关系。

2-1:单个分类变量(One Categorical Variable)

  • 条形图(Bar Plot):展示不同类别的频数或比例。
  • 棒棒糖图(Lollipop Plot):类似于条形图,但每个条形由线段连接,适合展示类别与数值的对应关系。
  • 华夫图(Waffle Chart):用格子表示频数,适合展示二分类或多分类数据。
  • 词云(Word Cloud):通过单词的大小和颜色展示文本数据的频率。
  • 甜甜圈图(Doughnut Chart):类似于饼图,但中间有空白,可以展示多个类别的比例。
  • 饼图(Pie Chart):展示各个类别占总体的比例。
  • 树状图(Treemap):用不同大小的矩形块展示类别和子类别的频数或比例。
  • 圆形填充图(Circular Packing):圆形嵌套展示类别和子类别的关系。

2-2:两个或更多分类变量(Two or More Categorical Variables)

1、两个独立列表(Two Independent Lists)

  • 文氏图(Venn Diagram):展示两个或多个集合的交集和并集。

2、嵌套(Nested)

  • 树状图(Treemap):展示类别和子类别的层次结构。
  • 圆形填充图(Circular Packing):圆形嵌套展示类别的层次结构。
  • 旭日图(Sunburst):环形嵌套展示类别和子类别的层次结构。
  • 条形图(Bar Plot):展示不同类别的频数或比例。
  • 树状图(Dendrogram):展示类别的层次结构或聚类结果。

3、子组(Subgroup)

  • 分组散点图(Grouped Scatter):展示不同子组的分布情况。
  • 热图(Heatmap):用颜色变化展示不同类别之间的关系或频数。
  • 棒棒糖图(Lollipop Chart):展示不同子组的数值。
  • 分组条形图(Grouped Bar Plot):展示不同子组的频数或比例。
  • 堆叠条形图(Stacked Bar Plot):展示不同子组的累积频数或比例。
  • 平行坐标图(Parallel Plot):展示多个分类变量之间的关系。
  • 蜘蛛网图(Spider Plot):展示多个分类变量的数值。
  • 桑基图(Sankey Diagram):展示不同类别之间的流动或转换。

4、邻接(Adjacency)

  • 网络图(Network):展示节点(类别)之间的连接关系。
  • 和弦图(Chord):展示不同类别之间的相互关系。
  • 弧线图(Arc):展示不同类别之间的连接关系。
  • 桑基图(Sankey):展示不同类别之间的流动或转换。
  • 热图(Heatmap):展示不同类别之间的关系或频数。

选择合适的图表类型取决于研究者希望传达的信息和数据的性质。

例如,如果需要展示不同类别的频数或比例,条形图或饼图可能是合适的选择。如果需要展示类别之间的层次结构,树状图或旭日图可能更合适。如果需要展示类别之间的相互关系,网络图或和弦图可能更适用。

正确选择和使用这些图表可以帮助研究者更清晰地展示和解释数据。


三、数值和分类变量

当涉及到数值(Numeric)和分类(Categorical)变量的组合时,选择正确的可视化方法可以帮助我们更有效地展示和分析数据。

3-1:一个数值变量和一个分类变量(One Numeric, One Categorical)

1、每个组只有一个观测值(One Obs. Per Group)

  • 箱线图(Box Plot):展示不同类别的数值分布。
  • 棒棒糖图(Lollipop Plot):展示每个类别的单个数值。
  • 甜甜圈图(Doughnut Chart):展示每个类别的数值占比。
  • 饼图(Pie Chart):展示每个类别的数值占比。
  • 词云(Word Cloud):通过单词的大小展示不同类别的重要性。
  • 树状图(Treemap):用不同大小的矩形块展示不同类别的数值。
  • 圆形填充图(Circular Packing):圆形嵌套展示不同类别的数值。
  • 华夫图(Waffle Chart):用格子展示不同类别的频数。

2、每个组有多个观测值(Several Obs. Per Group)

  • 箱线图(Box Plot):展示不同类别的数值分布。
  • 小提琴图(Violin Plot):展示数值的分布和密度。
  • 山脊线图(Ridgeline):展示多个分布的叠加。
  • 密度图(Density Plot):展示数值的概率密度函数。
  • 直方图(Histogram):展示数值的分布。

3-2:一个分类变量和多个数值变量(One Categorical, Several Numeric)

1、没有顺序的一个数值变量

  • 分组散点图(Grouped Scatter):展示不同类别的数值分布。
  • 二维密度图(2D Density):展示两个数值变量的联合分布。
  • 箱线图(Box Plot):展示不同数值变量的分布。
  • 小提琴图(Violin Plot):展示数值的分布和密度。
  • 主成分分析图(PCA):降维展示多个数值变量的关系。
  • 相关图(Correlogram):展示数值变量之间的相关性。

2、一个数值变量是有序的

  • 堆叠区域图(Stacked Area):展示随时间变化的多个数值变量。
  • 面积图(Area):展示数值变量随时间的变化。
  • 流线图(Streamgraph):展示数值变量的增减。
  • 线图(Line Plot):展示数值变量随时间或其他有序变量的变化。
  • 连接散点图(Connected Scatter):展示数值变量随时间的变化。

3、每个组只有一个值

  • 分组散点图(Grouped Scatter):展示不同组的数值。
  • 热图(Heatmap):用颜色展示不同组的数值关系。
  • 棒棒糖图(Lollipop Chart):展示每个组的数值。
  • 分组条形图(Grouped Bar Plot):展示不同组的数值。
  • 堆叠条形图(Stacked Bar Plot):展示不同组的数值累积。
  • 平行坐标图(Parallel Plot):展示不同组的多个数值变量。
  • 蜘蛛网图(Spider Plot):展示不同组的多个数值变量。
  • 桑基图(Sankey Diagram):展示不同组的数值流动。

3-3:多个分类变量和一个数值变量(Several Categorical, One Numeric)

1、子组(Subgroup)

每个组只有一个观测值
  • 分组散点图(Grouped Scatter):展示不同子组的数值。
  • 热图(Heatmap):用颜色展示不同子组的数值关系。
  • 棒棒糖图(Lollipop Chart):展示每个子组的数值。
  • 分组条形图(Grouped Bar Plot):展示不同子组的数值。
  • 堆叠条形图(Stacked Bar Plot):展示不同子组的数值累积。
  • 平行坐标图(Parallel Plot):展示不同子组的多个数值变量。
  • 蜘蛛网图(Spider Plot):展示不同子组的多个数值变量。
  • 桑基图(Sankey Diagram):展示不同子组的数值流动。

每个组有多个观测值
  • 箱线图(Box Plot):展示不同子组的数值分布。
  • 小提琴图(Violin Plot):展示数值的分布和密度。

2、嵌套(Nested)

每个组只有一个观测值
  • 条形图(Bar Plot):展示不同嵌套类别的数值。
  • 树状图(Dendrogram):展示嵌套类别的层次结构。
  • 旭日图(Sunburst):环形嵌套展示嵌套类别的数值。
  • 树状图(Treemap):用不同大小的矩形块展示嵌套类别的数值。
  • 圆形填充图(Circular Packing):圆形嵌套展示嵌套类别的数值。

每个组有多个观测值
  • 箱线图(Box Plot):展示不同嵌套类别的数值分布。
  • 小提琴图(Violin Plot):展示数值的分布和密度。

3、邻接(Adjacency)

  • 网络图(Network):展示不同分类变量之间的关系。
  • 和弦图(Chord):展示分类变量之间的相互关系。
  • 弧线图(Arc):展示分类变量之间的连接关系。
  • 桑基图(Sankey):展示分类变量的数值流动。
  • 热图(Heatmap):用颜色展示分类变量之间的关系或频数。

选择哪种图表类型取决于数据的特点、研究问题以及希望传达的信息。

例如,如果需要比较不同类别的数值分布,箱线图或小提琴图可能是合适的选择。如果需要展示多个分类变量与数值变量的关系,热图或平行坐标图可能更适用。

正确选择图表类型对于数据的解释和传达至关重要。


四、地图

地图(Maps)是一种强大的可视化工具,它可以用来展示地理空间数据,包括地理位置、区域特征和分布等。

4-1:基础地图(Map)

展示基本的地理信息,如国家、州、城市等边界,通常作为其他地图类型的底层。


4-2:连接地图(Connection Map)

展示不同地理位置之间的网络连接或流动路径,例如航线、交通路线或数据传输路径。


4-3:彩带图(Choropleth Map)

根据地理位置内的数值变量,用不同的颜色深浅来表示该数值的大小或密度。这种地图类型非常适合展示如人口密度、疾病发病率等在不同区域的分布情况。


4-4:六边形地图(Map Hexbin)

使用六边形网格来展示地理空间数据的分布,可以减少边界效应,提供更平滑的可视化效果。适用于展示密集区域的数据分布。


4-5:气泡地图(Bubble Map)

在地图上用不同大小的气泡来表示地理位置相关的数值大小,例如经济活动强度或事件发生频率。


应用场景分析

  1. 展示区域特征:如果需要展示某个区域内的特征或属性,如人口、收入水平等,可以使用彩带图或基础地图上叠加的气泡地图。

  2. 展示空间分布:当数据点在空间上分布不均匀时,使用六边形地图可以更有效地展示数据的密集程度。

  3. 展示流动和连接:如果研究的是不同地理位置之间的联系或流动,如贸易路线、移民流动等,连接地图是一个很好的选择。

  4. 比较区域差异:当需要比较不同区域在某个数值变量上的差异时,彩带图可以直观地展示这些差异。

  5. 展示地理空间模式:对于需要在地理空间上展示数据集中或分散的模式,基础地图配合其他图表类型(如散点图)可能更为合适。

  6. 强调特定地理位置:如果需要特别强调某些地理位置,可以在基础地图上使用标记或高亮显示。

选择正确的地图类型可以帮助观众更好地理解数据在地理空间上的分布和模式,从而更有效地传达研究结果。


五、网络图

网络图(Network)是一种用来表示实体(nodes)和它们之间的关系(edges)的可视化方法。

5-1:网络(Network)

  • 网络图:基本的网络图展示了节点和连接它们的边。适用于展示复杂的关系网络,如社交网络、互联网结构等。
  • 和弦图(Chord Diagram):展示节点间的双向关系,每个连接线表示两个节点之间的连接强度或流量。
  • 弧线图(Arc Diagram):以弧线形式展示节点间的单向或双向关系,适合展示层次较少的网络。
  • 桑基图(Sankey Diagram):展示节点间的流动关系,宽度表示流量的大小,常用于展示能量或物质的转移。
  • 热图(Heatmap):在网络图中,热图可以用来表示节点间连接的强度或频率。

5-2:嵌套或层次结构(Nested or Hierarchical)

无值和叶子节点有值(No Value & Value for Leaf)

  • 树状图(Dendrogram):展示层次结构的嵌套关系,常用于展示分类或聚类结果。
  • 树状图(Treemap):用不同大小的矩形块展示层次结构,每个矩形的面积代表数值的大小。
  • 圆形填充图(Circular Packing):圆形嵌套展示层次结构,适用于展示具有多个层级的组织结构。
  • 旭日图(Sunburst):环形嵌套展示层次结构,适合展示复杂的嵌套关系。
  • 桑基图(Sankey Diagram):在层次结构中展示节点间的流动关系。

边有值(Value for Edges)

  • 树状图(Dendrogram):如果边具有数值,可以展示层次结构中的数值关系。
  • 桑基图(Sankey Diagram):如果边具有数值,可以展示层次结构中的流动强度。
  • 和弦图(Chord Diagram):如果边具有数值,可以展示节点间关系的强度。

连接有值(Value for Connection)

  • 层次边缘捆绑(Hierarchical Edge Bundling):通过边缘的捆绑展示层次结构中的连接强度,适合展示复杂的层次网络。

应用场景分析

  1. 展示复杂网络:网络图适合展示包含大量节点和边的复杂网络结构。

  2. 展示双向关系:和弦图适合展示节点间的双向关系及其强度。

  3. 展示流动:桑基图适合展示节点间的流动关系,如信息流、物质流等。

  4. 展示层次结构:树状图、旭日图和树状图适合展示具有层次嵌套关系的组织结构。

  5. 展示层次中的数值关系:如果层次结构中的边具有数值,可以使用树状图或桑基图来展示这些数值关系。

  6. 展示层次网络的连接强度:层次边缘捆绑可以有效地展示层次网络中不同层级的连接强度。

选择正确的网络和层次结构可视化方法可以帮助观众更好地理解数据中的实体关系和层次结构,从而更有效地传达研究结果。


六、时间序列数据

时间序列数据通常用来展示随时间变化的数据点,分析趋势、季节性或周期性变化。

6-1:单个时间序列(One Series)

  • 箱线图(Box Plot):展示时间序列数据的分布情况,包括中位数、四分位数和异常值。适用于展示数据的集中趋势和离散程度。
  • 小提琴图(Violin Plot):结合了箱线图和密度图的特点,展示时间序列数据的分布和密度。
  • 山脊线图(Ridgeline):展示多个时间点的数据分布,适合比较不同时间点的分布变化。
  • 面积图(Area Plot):展示时间序列数据的累积效果,常用于展示随时间增长的量。
  • 线图(Line Plot):最常用的时间序列图,清晰展示数据随时间的变化趋势。
  • 条形图(Bar Plot):展示特定时间点的数值,适合展示周期性或特定事件的影响。
  • 棒棒糖图(Lollipop Chart):每个棒棒糖代表一个时间点的数值,适合展示关键时间点的数据。

6-2:多个时间序列(Several Series)

  • 箱线图(Box Plot):展示不同时间序列的分布情况,适合比较各序列的集中趋势和离散程度。
  • 小提琴图(Violin Plot):展示不同时间序列的分布和密度,适合比较各序列的分布特征。
  • 山脊线图(Ridgeline):展示多个时间序列在不同时间点的分布,适合比较多个序列的分布变化。
  • 热图(Heatmap):用颜色变化展示不同时间序列在不同时间点的数值大小,适合展示数据的强度和变化。
  • 线图(Line Plot):展示多个时间序列随时间的变化趋势,适合比较多个序列的动态变化。
  • 堆叠面积图(Stacked Area):展示多个时间序列的累积效果,常用于展示各部分随时间的增长和总体的变化。
  • 流线图(Streamgraph):堆叠面积图的变体,通过正负值的变化展示时间序列的增减,适合展示数据的流动感。

应用场景分析

  1. 展示趋势:线图是展示时间序列趋势的首选,清晰直观。

  2. 比较分布:箱线图和小提琴图适合展示和比较不同时间序列的分布特征。

  3. 展示周期性变化:条形图和棒棒糖图适合展示周期性或特定时间点的数据。

  4. 展示累积效果:面积图和堆叠面积图适合展示随时间累积的量。

  5. 比较多个序列:热图和流线图适合比较多个时间序列在不同时间点的变化。

  6. 展示数据的强度和变化:热图通过颜色变化直观展示数据的强度和变化。

选择正确的时间序列可视化方法可以帮助观众更好地理解数据随时间的变化和趋势,从而更有效地传达研究结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值