以下数据可视化教程的实现工具使用的是帆软FineBI,针对2018年1~5月中国空调销售的数据,现在需要对下面的情况进行分析:
1) 产品价格与销量间的关系。
2)各类产品在各价格段的销售量分布情况。
3) 销量前10的品牌及其利润关系。
目录
知识准备
1.数据的联系和分布
数据的联系主要是分析数据中各个变量之间的关系,比如散点图主要是分析因变量随自变量而变化的大致趋势,由此趋势可以选择合适的函数进行经验分布的拟合,如线性关系、指数关系、对数关系等。数据的分布主要是分析数据分布的规律,比如正态式分布、线性分布。数据的分布和联系可视化图表如图1所示。
图1 数据的分布和联系可视化图表
2.表示数据联系和分布的可视化图表
表示数据联系的可视化图表有气泡图和散点图。其中散点图表示数据中两个变量之间的联系,如图2所示,而气泡图可以表示三个变量之间的联系,如图3所示。散点图是指在数理统计回归分析中,数据点在直角坐标系平面上的分布图,散点图核心的价值在于发现变量之间的关系。
同时,散点图可以用于表示数据的分布。另外直方图也非常适合表示数据的分布情况。
由于散点图一般研究的是两个变量之间的关系。因此,气泡图就是在散点图的基础上增加变量,提供更加丰富的信息,点的大小或者颜色可以定义为第三个变量。所示气泡图可以看作是散点图的变形。气泡图通常用于展示和比较数据之间的关系和分布,一般用颜色映射类型,用圆圈大小映射数值。