在数据分析领域需要用到图表来展示分析结果。
一 图表的构成
1 图表的元素及类型
由于用户的阅读习惯通常是“之”字形,即左上角开始按“之”字型扫视屏幕或整个页面,所以设计图表时需要将最重要的内容放在最左边的顶端位置以便用户能够阅读。
1.1 图表中的6种元素
- 图表的标题
- 横轴及纵轴的标题
- 类别名称
- 图例
- 网格线
- 数据来源
通常为了精简,图表中不需要全部体现以上六种元素。
1.2 图表的类型
1)4种常见类型
i)散点图
使用场景:用于直观的展示两个指标/变量之间的关系或相关性,尤其是大数据量的时候散点图会有更精确的结果。
ii)折线图
即用线条将相关的数据点连在一起,帮助用肉眼观察随着时间的变化,数据是怎样的变化趋势。
使用场景:用于可视化含有时间序列的数据。
iii)柱状图
①堆积柱状图
- 能够比较各个类别总体的区别以及每个类别中子成分的占比情况
- 无法对占比近似的子成分做比较
②瀑布图
- 用于抽离出堆积柱状图中的一部分重点关注
- 用于展示起点和结果以及其中上升/下降的变化情况
③直方图
- 用于查看分类数据/ 离散数据的分布情况
iv)条形图
条形图即横置的柱状图。
2)由4种基本图形演化的其他图形
i)饼图
- 饼图是用面积表示数据的占比
- 应避免使用饼图
ii)箱线图
- 箱线图用于表示数据的描述统计信息,即四分位数
- 线的上下两端表示数据集的最大值及最小值
- 箱子的上下两端表示这组数据集中排在前25%和前75%位置的数值
- 箱子中间的横线表示中位数
iii)热力图
- 热力图是由高亮形式来展示数据。
常见的例子是用热力图表示道路交通状况。
热力图也可以用于网站或手机app的用户行为分析,将用户浏览、点击、访问页面居多的位置以高亮的格式化形式展示,从而根据用户观看的行为数据来改善网页或app的设计。
iv)雷达图
- 用于在固定的框架内表达某种已知结果</