常见可视化图表介绍

目录

目录

前言 主要介绍下常见的图表

常见的初级图表

1.散点图

2.气泡图

3.折线图

4.面积图

5.柱形图

6.直方图

7.饼图

8.漏斗图

9.雷达图

常见的高级图表 

10.树形图

11.桑基图

12.热力图

13.箱线图

14.地理图

图表绘制的技巧


前言 主要介绍下常见的图表

在数据分析中,图表展示能够很直观的表明数据结论。作为一个数据分析师,就必须掌握常规的图表使用场景以及制作。

数据可视化的目的是让数据更高效展示,让读者更高效阅读,突出数据背后的规律,突出重要的因素,最后是美观。

常见的初级图表

图表的基础概念

  • 描述分析的角度和属性,分类数据(时间、地理位置、产品类型等)
  • 具体的参考数值,数值数据(元、销售、活跃量级等)

1.散点图

散点图是指在回归分析中,数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。

用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。散点图将序列显示为一组点。值由点在图表中的位置表示。类别由图表中的不同标记表示。散点图通常用于比较跨类别的聚合数据。

2.气泡图

气泡图(bubble chart)是可用于展示三个变量之间的关系。具有下列图表子类型:气泡图和三维气泡图,气泡图与 XY散点图 类似,但是它们对成组的三个数值而非两个数值进行比较。

另有变化为单轴散点气泡图

​ 

3.折线图

折线图是排列在工作表的列或行中的数据可以绘制到折线图中。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。

4.面积图

 面积图强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。例如,表示随时间而变化的利润的数据可以绘制在面积图中以强调总利润。

5.柱形图

柱形图,又称长条图、柱状统计图,亦称条图条状图棒形图,是一种以长方形的长度为变量的统计图表。长条图用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。长条图亦可横向排列,或用多维方式表达。

6.直方图

直方图(Histogram),又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。

直方图是数值数据分布的精确图形表示。 这是一个连续变量(定量变量)的概率分布的估计,并且被卡尔·皮尔逊(Karl Pearson)首先引入。它是一种条形图。

7.饼图

饼图英文学名为Sector Graph,又名Pie Graph。常用于统计学模块。2D饼图为圆形,手画时,常用圆规作图。

仅排列在工作表的一列或一行中的数据可以绘制到饼图中。饼图显示一个数据系列 (数据系列:在图表中绘制的相关数据点,这些数据源自数据表的行或列。图表中的每个数据系列具有唯一的颜色或图案并且在图表的图例中表示。可以在图表中绘制一个或多个数据系列。饼图只有一个数据系列。)中各项的大小与各项总和的比例。饼图中的数据点 (数据点:在图表中绘制的单个值,这些值由条形、柱形、折线、饼图或圆环图的扇面、圆点和其他被称为数据标记的图形表示。相同颜色的数据标记组成一个数据系列。)显示为整个饼图的百分比。

8.漏斗图

漏斗图是一个简单的散点图,反映研究在一定样本量或精确性下单个研究的干预效应估计值。漏斗图最常见的是在横轴为各研究效应估计值,纵轴为研究样本量。

干预措施疗效的比率指标(如比值比、风险比)要在对数尺度上绘制,这能使同样大小、但方向相反的疗效值(如比值比0.5、比值比2)与1.0等距。对以连续性(数值型)尺度表示的结局(如血压、抑郁评分),应以均数差或标准化均数差衡量干预措施疗效,这些统计指标可作为漏斗图的横轴。

9.雷达图

雷达图是以从同一点开始的轴上表示的三个或更多个定量变量的二维图表的形式显示多变量数据的图形方法。轴的相对位置和角度通常是无信息的。 雷达图也称为网络图,蜘蛛图,星图,蜘蛛网图,不规则多边形,极坐标图或Kiviat图。它相当于平行坐标图,轴径向排列。

常见的高级图表 

10.树形图

 树形图(Tree Diagram)是用来表示一个概率空间。树形图可以表示独立事件(例如多次掷硬币)和条件概率(例如不放回的抽卡)。

11.桑基图

 桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,右图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名,此后便以其名字命名为“桑基图”。

12.热力图

以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。热力图可以显示不可点击区域发生的事情。城市热力图该检测方式只提供参考。

ps:后续可介绍下python画桑基图、热力图。

13.箱线图

箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数;然后, 连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间。

14.地理图

图表绘制的技巧

单一图表的可视化一样不大,三表成虎🐯。围绕以下三原则:

  • 主次分明
  • 贴合场景
  • 指标结构

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值