描述统计2:数值方法

2.1 位置的度量
平均数、中位数、众数、百分位数、四分位数
mean,median,mode,IQR(inter-quartile range)

2.2 变异程度的度量
极差、四分位数间距、方差、标准差、标准差系数

2.3 分布形态、相对位置、异常值检测
偏度、Z-分数、切比雪夫定理、经验法则
切比雪夫定理描述与平均数相差某个特定个数的标准差的数据所占的比例。
异常值检测,与平均数相差+3或者-3个标准差以上的值就算异常值。经验法则依赖于正态分布。

2.5 探索性数据分析
五数概括法、箱线图

2.6 两变量间关系的度量
协方差,受变量单位的影响,因此有相关系数。
相关系数为1时,表示变量间存在斜率为正数的直线。越接近1越正相关,接近0表示不存在相关关系。
相关系数是对变量间相关而非因果关系的度量。

2.7 加权平均数、分组数据
加权数据表示了每个观测值的权重。
分组数据在计算相关的描述统计量时采用平均数即组中值代表分组数据的观测值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值