【数据科学家学习小组】之数据可视化(第二期)
本系列文章主要目的有两个:
- 从数据可视化的角度出发,总结一下现在无论是数据可视化还是报表开发、BI开发的工具和思路
- 从木东居士的学习小组学习到一些大厂的工作学习思路,让自己思考的更全面更成熟,完成的文档也更加全面、漂亮。
学习内容
「时序数据」和「比例数据」的可视化
- 了解时序数据的特点,熟练掌握不同类型的时序数据分别适合的图表类型;
- 了解比例型数据可视化的目的,学会根据数据集的特征去选择合适的图表;
- 实践:从给定的4个数据集中挑选两个,自行选择合适图表并进行可视化呈现
知识总结
时序数据:
- 离散时间点(少周期):柱状图、并列柱状图、堆叠柱状图、百分比堆叠柱状图等
- 重点突出:数据构成不要太多
- 分类占比变化:使用百分比堆叠柱状图
- 对比明显:数据条数不要太多
- 连续时间点(多周期):折线图、面积图、堆叠面积图、瀑布图(阶梯图)、拟合曲线图等
- 点线图:数据项不超过12个
- 折线图:当数据集中的数据项比较多,大于12条时,采用点线图,会让整条线上的点很密集,影响看数据的趋势,此时采用折线图是不错的选择
- 曲线图:相邻节点的连线更加平滑,更能体现趋势变化
- 阶梯图:某两个相邻的时间节点