03 数据分析之分布分析

分布分析关注数据的分布情况,以揭示事件规律。定量分析包括衡量中心位置(均值、中位数等)和分散程度(方差、标准差等),用于评估数据波动及其原因。图形特征帮助识别离散性随机变量类型,如0-1分布、二项分布和泊松分布。定性数据分析则旨在找出类别间的区别,定时数据分析通过周期性和时间序列分析探索随时间变化的规律。
摘要由CSDN通过智能技术生成

分布分析

对数据的分布情况进行描述,从而对事件的发生规律有准确的认识

  1. 定量数据
    目的是可以让我们了解:

    • 事件发生的一般结果是什么 --集中趋势
    • 事件结果的变化情况 – 离中趋势
    • 事件各个结果的发生概率是什么 --图形特征

    定量分析的指标:
    - 中心位置/集中趋势 :均值、中位数、众数、四分位数
    - 分散程度/离中趋势:方差、标准差、极差、变异系数{标准差/平均值}
    同一对象不同时间的波动:
    方差大:受外界因素影响较大,可以通过特征的贡献度分析析,寻找影响波动的原因。查看是否存在周期性
    方差小:可以通过时间序列等方法进行预测
    同一对象相同时间的波动:
    方差大:各个对象间的差异较大,可以寻找差异大的原因,异常值中一般蕴藏着机会
    方差小:各对象之间的差异不大,对象的属性对结果的影响不大
    - 图形特征
    离散性随机变量的类型:
    - 0-1 分布 :某一件事发生的结果只有0和1两种取值
    - 二项分布:每次试验中只有两种可能的结果,而且两种发生与否互相对立与其它各次试验结果无关,
    事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,
    当试验次数为1时,二项分布服从0-1分布。
    - 泊松分布:当某个事件出现的概率很小,但它又是无时无刻随时可能出现的,
    那么当我们现在要求出一段时间内发生这种事件次数的概率时,
    就可以全用泊松分布来计算概率

     					
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值