单峰分布(unimodal distribution)、双峰分布 (bimodal distribution)以及偏态分布(skewness distribution)

单峰分布(unimodal distribution)& 双峰分布 (bimodal distribution)

数据分布会有一个或者很多个峰值(peaks),数据分布中只有一个明显峰值的叫做单峰,有两个明显峰值的叫做双峰,同样,具有多个峰值的就是多峰。

偏态分布(skewness distribution)

在数据分布的图像展现形式中,偏态分布中一边的观测值要比另一边的观测值多,右边的观测值少时,称为右偏(skewed right);左边的观测值少时,称为左偏(skewed left)。相对于正态分布,右偏的分布也称为正偏态分布,以平均数(average)、中位数(median)和众数(mode)之间的关系来描述的话,若 x ˉ > M e > M o \bar{x} > M_{e} > M_{o} xˉ>Me>Mo,也即是平均数大于中位数,中位数又大于众数时,数据分布时正偏态分布。

左偏的分布也称为负偏态分布,若 x ˉ &lt; M e &lt; M o \bar{x} &lt; M_{e} &lt; M_{o} xˉ<Me<Mo,也即是平均数小于中位数,中位数又小于众数时,数据分布时负偏态分布。

均匀分布(uniform distribution)

当一组数据中的观测值在分布范围内均匀分布时,这种分布称为均匀分布。均匀分布没有明显的峰。

正态分布(normal distribution)

当数据的分布图,既具有对称性,又具有单峰时,就是正态分布,也即是单峰对称分布就是正态分布

异常特性(Unusual Features)

数据分布中的异常特性主要是两种:缺口(gaps) & 异常(outliers)
缺口主要是指数据分布中有些区域没有观测值:

异常主要是与数据分布差别很大的极端值。在正态分布中,如果极值低于第一个四分位数(Q1)至少1.5个四分位数区间,或者高于第三个四分位数(Q3)至少1.5个四分位数区间,那么极值通常被认为是一个离群值。

Ref

Data Patterns in Statistics

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值