数据分析学习笔记(五)数据可视化
数据可视化之美
优点:直观,缺点:阅读性差
- 数据可视化
数据可视化的目的是让数据更高效,让读者更高效阅读,而不单是自己使用。
突出数据背后的规律 — 突出重要的因素 — 最后是美观
常见的初级图表
图标的基础概念
维度和度量
维度是常用类别
度量是数值,具体的用数字来表示
通常绘制图表,用维度和度量的组合来绘制。
散点图
散点图:散点图主要解释数据之间的规律。
度量需要2个,x轴y轴,身高体重,
维度:若区分男女性别,可加入颜色
气泡图
气泡图是散点图的变种,引入了第三个度量作为气泡的大小。
若单纯x轴y轴两个度量不够明显,可使用气泡图,气泡大小作为度量。
下图中气泡越大,这个国家人数越多。
单轴散点图
维度作Y轴,更倾向于洞察数据在不同类别下的数据规律
本身可以把度量作为维度。
客户消费维度
消费金额和消费次数的关系
消费金额和最后一次距今消费天数的关系
消费次数和最后一次距今消费天数的关系
客户其他消费维度
消费金额和消费折扣的关系
消费金额和会员积分的关系
消费次数和会员距离的关系
垂直领域消费维度
投资金额和投资次数的关系(金融)
最近一次距今消费和使用次数(SaaS)
折线图
折线图
折线图经常用来观察数据随时间变化的趋势。
折线图中的维度不宜过多,否则会非常混乱和复杂。
面积图
面积图是折线图的变种。面积图更注重数据类别之间随着时间趋势的变化关系。
柱形图
柱形图:柱形图是类别之间的关系。
直方图
直方图:柱形图的统计型变种。而且,柱子直接宽距为0。
正负比例柱形图,翻转条形图,堆积柱形图,瀑布图(对于正负关系敏感的数据)
饼图
饼图可以理解为环状的柱形图。饼图的类别不宜过多。饼图除了PPT,分析时没啥用。
饼图用面积大小表示比例关系,但是肉眼有时候不能准确分辨面积大小。
漏斗图
漏斗图是对转化过程的直观展示。单一的漏斗图没啥用,也是面向PPT。
漏斗图的转化步骤不应该超过七个。
雷达图
适用于个体的数据和属性可视化,比较偏描述性数据,常见于CRM,用户画像。
常见的高级图表
树形图
树形图:适合数据量较大的情况,尤其类别较多。经常和多维分析来结合,比如各类电商的SKU。
通过矩形面积来展示。
桑基图
桑基图是揭示数据复杂变化趋势的图表。面积图(漏斗图)是线性维度,而桑基图可以一对多或者多对一。
最初的用来绘制能量变动。
可以和用户数据变动相关联,比如用户活跃状态变化,活跃用户–忠诚用户,忠诚–流失,流失–回流等等。
热力图
数据在空间上的变化规律。譬如地理空间,譬如网页浏览。
热力图:空间不一定是纯粹空间,也可以是属性和维度的规律组合,比如把它变成星期表。
揭示一些特殊时间规律。
关系图
展现不同类别之间的数据关系,常见于各类社交、社会媒体。微博传播,某用户帖子怎么传播,用户之间关注关系等。
箱线图
箱线图是统计用图表,用来研究和观察数据分布,也能对比数据分布。
标靶图
也称为子弹图,是变种的条形图。常用于衡量业务销售完成情况。
和销售业绩KPI挂钩,基准线和进度。
词云图
文本分析利器,PPT常客,卖弄大数据之必备图表
地理图
数据和空间之间的关系。地理图即可以通过经纬度的数值度量绘制,也能通过省市的类别维度绘制。
图表绘制
Excel绘制
绘图
配色
调色网站
甘特图:项目管理中用于可视化进度
杜邦分析法
可视化BI
BI
Dashboard
很多BI是可以后台监控的,调取监控日志,看哪些人群会看BI
PowerBI很强大,但是后面还要再学,只是自己跟着练了下基本操作。