【数据科学家学习小组】之数据可视化(第一期)第一周 学习总结
本系列文章主要目的有两个:
- 从数据可视化的角度出发,总结一下现在无论是数据可视化还是报表开发、BI开发的工具和思路
- 从木东居士的学习小组学习到一些大厂的工作学习思路,让自己思考的更全面更成熟,完成的文档也更加全面、漂亮。
整体流程
确定主题
比如,银行分析不同城市用户的储蓄率、储蓄金额,电商平台进行双十一的实时交易情况的大屏直播,物流公司分析包裹的流向、承运量和运输时效,向政府机构或投资人展示公司的经营现状等,都可以确定相应的数据主题。
提取数据
-
确定数据指标
业务的分析有很多不同的角度,也就存在不同的衡量指标。所以首先要确定分析主题下涉及的数据指标。
-
明确数据间的相互关系
围绕数据指标确定相关的维度和度量以及相互关系。
-
趋势型:
通常研究的是某一变量随另一变量的变化趋势,常见的有时间序列数据的可视化。
-
对比型:
对比两组或者两组以上的数据,通常用于分类数据的对比。
-
比例型:
数据总体和各个构成部分之间的比例关系。
-
分布型:
展现一组数据的分布情况,如描述性统计中的集中趋势、离散程度、偏态与峰度等。
-
区间型:
显示同一维度上值的不同分区差异,常用来表示进度情况。
-
关联型&#x
-