初学数据挖掘——数据探索(三):数据特征分析之对比分析

一、对比分析:

对比分析是将两个相互联系的指标进行比较,从数量上展示和说明研究对象的各种关系(规模的大小、水平的高低、速度的快慢等)是否协调。分析其中的差异,从而揭示这些事物代表的发展变化情况以及变化规律。

二、对比分析的原则:

  1. 对比对象相似:对比对象越相似,就越具有可比性。
  2. 对比指标同质

三、对比分析的特点:

  • 简单:因为与其他分析比较对比分析操作步骤少,不需要太复杂的计算。
  • 直观:是指能够直接看出事物的变化或差距,非常明显的知晓对比数据的相同或不同。
  • 量化:是指能够准确表示出变化或差距是多少,然后根据变化或差距的度量值,进行细分找到原因。

四、对比分析分类

1、绝对数比较

利用绝对数进行比较,从而寻找差异的一种方法。

2、相对数比较

由两个有联系的指标对比计算,用来反映客观现象之间数量联系程度的综合指标,其数值表现为相对数。
相对数可分为以下几种:

  1. 结构相对数:将同一总体内的部分数值与全部数值进行对比求得比重,用以说明事物的性质、结构或质量。
  2. 比例相对数:将同一总体内不同部分的数值进行对比,展示总体内各部分的比例关系。
  3. 比较相对数:将同一时期两个性质相同的指标数值进行对比,说明同类对象在不同空间条件下的数量对比关系。
  4. 强度相对数:将两个性质不同有一定联系的总量指标进行对比,用来说明现象的强度、密度和普遍程度。
  5. 计划完成程度相对数:将某一时期实际完成数与计划数进行对比,用以说明计划完成程度。
  6. 动态相对数:将同一现象不同时期的指标数值进行对比,用以说明发展方向和变化速度。

五、实例

1、动态相对数
现有各菜品的销售数据:
链接:https://pan.baidu.com/s/1cWn6JmnmwZUDQ7bgv7_V-A
提取码:2677

以及B部门的销售数据:
链接:https://pan.baidu.com/s/1b3TXAq_9qjziy8RCRiA9xw
提取码:2677

部分数据示例:
在这里插入图片描述

现分析各部门销售金额随时间的变化趋势:

# 不同部门在各月份的销售对比情况
# 部门之间销售金额比较
import pandas as pd
import matplotlib.pyplot as plt
data=pd.read_excel("./data/dish_sale.xls") #读入数据
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号
plt.figure(figsize=(8, 4))
plt.plot(data['月份'], data['A部门'], color='green', label='A部门',marker='o') #绘制A部门曲线
plt.plot(data['月份'], data['B部门'], color='red', label='B部门',marker='s') #绘制B部门曲线
plt.plot(data['月份'], data['C部门'],  color='skyblue', label='C部门',marker='x') #绘制C部门曲线
plt.legend() # 显示图例
plt.ylabel('销售额(万元)')
plt.show()

在这里插入图片描述

#  B部门各年份之间销售金额的比较
data=pd.read_excel("./data/dish_sale_b.xls")
plt.figure(figsize=(8, 4))
plt.plot(data['月份'], data['2012年'], color='green', label='2012年',marker='o')
plt.plot(data['月份'], data['2013年'], color='red', label='2013年',marker='s')
plt.plot(data['月份'], data['2014年'],  color='skyblue', label='2014年',marker='x')
plt.legend() # 显示图例
plt.ylabel('销售额(万元)')
plt.show()

在这里插入图片描述

©️2020 CSDN 皮肤主题: 数字20 设计师:CSDN官方博客 返回首页