NOTE【数据分析】描述统计学

           描述统计通俗来说就是对大量信息进行归纳,找出相应的指标对此进行描述。

也就是将复杂的数据简化为能起到描述性的数字(可衡量的指标)。

常用描述数据集整体情况的指标有:

1. 平均值

描述整体情况,但当有异常值或特殊值干扰时则不准确。

2. 中位数-四分位数

可避免异常值干扰,用箱线图描述。

Q3(上四分位)

Q2(中位数)

Q1(下四分位)

用Turkey‘s test 方法来识别异常值:

最小估计值:Q1 - K(Q3-Q1)

最大估计值:Q3 + K(Q3-Q1)

(K= 1.5: 中度异常;K = 3: 极度异常)

3. 标准差

用于衡量波动性、离散程度、变异性。

4. 标准分

标准分Z代表距离平均值有多少个单位的标准差,可衡量偏离平均值的程度(可用于质量管理)。

质量管理体系中,常用6西格玛体系。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值