数据分析中的概率分析经验总结:正态分布随机数&置信水平

一、正态分布:

  1. 非标准正态分布:先计算μ(总体平均数)& σ(标准差),然后通过换算将非标准正态分布转化为标准正态分布

  2. 标准正态分布:μ=0,σ=1—— N(0,1)

  3. 假设μ=30,σ=5,要计算P落在20<x<40概率
    =P(20<x<40)
    =F(40)-F(26)
    =φ((40-30)/5)-φ((26-30)/5)
    =F(2)-F(-0.8)
    =0.97725-0.2119
    =0.7654

  4. 上述计算过程涉及对照表可在网页工具查到:
    https://www.shuxuele.com/data/standard-normal-distribution-table.html
    (这个网站很好很用心,翻译自math is fun)
    在这里插入图片描述

  5. 实际应用:很多数据的峰值变化趋势,往往符合正态分布,如果要预测数据超过XX的概率,可以
    使用正态分布进行描述;再比如不同类别变化幅度不一,设置预警阈值时可以根据各自历史σ值来设置

二、置信水平

  1. 置信水平:结果落在标定区间的概率,也叫置信度,可信度
  2. 置信区间:假设抽样误差为±3%,统计结果为P=60%,则置信区间为57%-63%
  3. 样本量(计算公式):n=Z22 /d2
    n:样本量
    Z:正态分布中的Z统计量,如95%置信水平的Z统计量为1.96
    σ:样本整体的标准差
    d:置信区间的1/2,一般称为抽样误差、容许误差、调查误差
  4. 实际应用:过程指标管控中,往往需要排除样本量过小带来的不确定性,此时可选择仅考核指标的最小样本量
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值