html用颜色区分不同区间数据_数据可视化5-常用图表的对比

本文对比了柱状图、条形图、直方图、堆叠柱状图、百分比堆叠柱状图、折线图、面积图、散点图和气泡图的适用场景。通过实例展示了如何根据业务需求选择合适的图表类型,如分析商品单价分布、销售额TOP5产品、商品销售数量趋势和运输方式占比等。
摘要由CSDN通过智能技术生成

a0f8f9d2ddbaff0c51df122ae2a23096.png

接上回:

Tao:数据可视化4-区间型、关系型和地理型数据​zhuanlan.zhihu.com
b4f3dad194126b00f405601b9038f8b8.png

本章文章参考木东居士公众号,作者Destiny:

如何优雅地选择数据图表:常用图表对比​mp.weixin.qq.com
6dbfb926dbada09e50a3604ab32b13a9.png

本篇学习了常用图表之间的对比,包括:

  • 柱状图 VS 条形图
  • 柱状图 VS 直方图
  • 堆叠柱状图 VS 百分比堆叠柱状图
  • 折线图 VS 面积图
  • 堆叠面积图 VS 百分比堆叠面积图
  • 堆叠面积图 VS 堆叠柱状图
  • 散点图 VS 气泡图

按照惯例,先上脑图:

8609d5bc358920c24075a3609d41eaae.png

柱状图 VS 条形图

b9adcd0e44e7068684ae66a37131922c.png
图片来源公众号:数据科学家联盟

704e37edca68cbeb73469b9ed56016c9.png

一般情况可以互换,当数据量大或者分类文本过长时,条形图效果更佳

柱状图 VS 直方图

da148c452fe69fb39f28bd2c190ce96f.png
图片来源公众号:数据科学家联盟

87b084375d26dfe9511c2c73441dd237.png

柱状图看数据,看趋势。直方图看分布。作用不同,不能互换。

堆叠柱状图 VS 百分比堆叠柱状图

bda36a514144e8e827974987864bf8ee.png
图片来源公众号:数据科学家联盟

f5c0cd9360e8a987a74c66f9a646ebaf.png

要看总体变化趋势及各构成占比选堆叠柱状图,要看各构成占比随时间变化趋势选百分比堆叠柱状图。

折线图 VS 面积图

ff15a0d29f4a6b705f2847d530749ef1.png
图片来源公众号:数据科学家联盟

e099808684bb9461bcf3b761fea4ad4f.png
图片来源公众号:数据科学家联盟

64397c4a860991199297ce6877c34daf.png

只看整体数据趋势可以互换,要看各构成占比随时间变化选择面积图

堆叠面积图 VS 百分比堆叠面积图

469af183d85ccce8065edcc74f9ea2e8.png
图片来源公众号:数据科学家联盟

ed317cf904a1e542db0a03f81b141d6d.png

类似于堆叠柱状图和百分比堆叠柱状图的关系,不同在于面积图用于时间序列。

堆叠面积图 VS 堆叠柱状图

577401decb1c3a9a5123ab59a797f5ed.png
图片来源公众号:数据科学家联盟

e01b3e0214b8ab1f5d7b9ca92f537ba1.png

当需要对比不同分类的构成情况时,使用堆叠柱状图。比较单一类别的各部分构成随时间变化时,用堆叠面积图。

散点图 VS 气泡图

eb7293fba8c204484655dc77d15de5e9.png
图片来源公众号:数据科学家联盟

9d3ef399f72093038bd2522a666e36c8.png

当展示两个维度的分布情况时,使用散点图,不同类别用颜色或形状区分(eg.男女的身高和体重的关系)。

当展示三个维度的分布情况时,使用面积图,不同分类用颜色区分(eg.成本、销量、销售额之间的关系)

练习:

数据源:

bdf2439e6d9e085c465a202249f476f6.png
图片来源公众号:数据科学家联盟

共301条数据,无脏数据、空值

可以看到,一共有19个变量,当然我们不可能把这些数据全部用上。根据第一周所学内容,可视化的步骤是 确认主题→提炼数据→确定图表→可视化设计,所以一定要根据业务需求来做可视化。

提出问题:

  1. 想了解一下全部发货物品的单价的分布情况,每10元作为一个区间?
  2. 展示销售额TOP5的产品二级大类?
  3. 按月份展示商品的销售数量趋势?
  4. 展示不同年份的商品的销售数量,及其不同年份三种运输方式的数量占比?

明确目的之后就要提炼数据

全部发货物品的单价的分布情况(bin=10)

  1. 确认主题,明确目的。研究商品单价的分布情况
  2. 提炼数据。目标数据: 单价
  3. 确定图表:展示分布情况,用直方图
  4. 可视化

因为单价数据里有几个特别大的值,影响了整体的效果。鉴于我们是看分布情况,个别极端数值可以剔除掉,现在我们去掉800之后的数值

00f26bf9c57d89fe304f2b7f0a4770d0.png

结论:可以看到37%左右的商品单价都在0~10元之间,50%左右的商品单价分布在0~20元之间。典型的长尾分布。

Tao:Tableau基础教程系列01-直方图​zhuanlan.zhihu.com
5a66d818f4af10c557c70bb1892351d7.png

展示销售额TOP5的产品二级大类

  1. 确认主题,明确目的。
  2. 提炼数据。目标数据: 销售额、产品二级子类
  3. 确定图表:展示单一类别的数据对比,选择单一柱状图
  4. 可视化

c50f030961c56a0589294fa114690fc4.png

结论:销售额前五包括:办公机器、电话通信产品、桌子、容器及箱子、椅子。TOP5中,办公机器销售额最高,椅子销售额最低。由此可见,企业及用户才是大头,应该加大B端市场的开拓。

按月份展示商品的销售数量趋势

  1. 确认主题,明确目的。
  2. 提炼数据。目标数据: 订单日期、商品数量
  3. 确定图表:展示单一类型数据随时间变化的趋势,可以选择折线图或面积图
  4. 可视化

90832086dda870711547db0923d53e18.png

结论:销售数量随月份变化的趋势不是很明显,波动幅度较大。

让我们按年为周期再看一下:

e6bab22e4b9e41a4f59e25b7e84cba55.png

2009→2010年件销量涨幅很大,约为52%。到2011年销量水平又跌回近乎和2009年相同水品,随后的一年销量几乎持平。

不同年份三种运输方式的数量占比

  1. 确认主题,明确目的。
  2. 提炼数据。目标数据: 运输方式、订单日期
  3. 确定图表:展示4个年份内3种运输方式的占比,只看占比不看总体趋势,选择百分比堆叠柱状图
  4. 可视化

37a0ca629083d4482eb58b2ae878ed6f.png
  1. 四年中火车的占比最高,一直保持在69%的占比之上,2011年火车占比达到最大82.19%,压缩了大卡和空运的占比。
  2. 2009→2010年空运占比翻了一倍,从7.94%涨到了16.16%,相比较而言火车的占比降低了8%左右。随后2010~2012年空运的占比逐渐降低,2012年空运占比低于2010年。
  3. 大卡占比除了2011年被火车压缩到6.85%。其余年份占比无太大变化,保持在14%~17%之间

PS:作图后最好跟数据源做下对比,避免做错

本节作图教程:

Tao:超详细Tableau零基础教程系列01-直方图​zhuanlan.zhihu.com
5a66d818f4af10c557c70bb1892351d7.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值