数据特征分析

这篇博客深入探讨了数据特征分析的多个方面,包括分布、对比、统计量(如均值、中位数、标准差)、周期性、贡献度(如二八定律)以及相关性分析。内容涵盖计算和可视化方法,如散点图、直方图和箱型图,为理解数据行为提供了关键工具。
摘要由CSDN通过智能技术生成

1、分布分析



2、对比分析



3、统计量分析

1)集中趋势度量:(均值、中位数)

           均值:---------所有数据的平均值。

          中位数:-------将一组观察值从小到大按顺序排列,位于中间的那个数据。

          众数:----------数据集中出现最频繁的值。

2)离中趋势度量:(标准差(方差)、四分位数间距)

          极差:----------最大值-最小值

         标准差:--------度量数据偏离均值的程度

         变异系数:

         四分位数间距:上四分位数-下四分位数

4、周期性分析

周期性、季节性-----月度周期性、周度周期性、甚至天、小时

5、贡献度分析

二八定律----帕雷托图

80%的利润常常来自于20%的最畅销产品。

6、相关性分析

1)散点图

2)散点图矩阵

3)计算相关系数

      Pearson相关系数--------------------两个连续性变量之间的关系,要求连续变量的取值服从正态分布

      Spearman秩相关系数--------------连续,不服从正态分布

      判定系数

      判定系数


#####################

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值