31 基本统计概念

标签:机器学习与数据挖掘

1.集中趋势的描述指标

算数均数(Arithmetic Mean):总体均数用希腊字母 μ \mu μ表示,样本均数常用 X ˉ \bar{X} Xˉ
中位数 (Median):将全体数据按大小排列,取在整个数列中最中间的位置的那个值。
几何均数(Geometric Mean):使用字母G表示,适用于原始数据分布不对称,但经过对数转换呈分布的资料
截尾均数(Trimmed Mean):考虑去掉两端比较极端的数。再计算平均数。

2.离散趋势的描述指标

①极差(Range):全组内数据中最大值与最小值的差。
②方差(Variance)和标准差(Standard Deviation):总体和样本的标准差分别用 σ \sigma σ s s s 来表示,方差即标准差的平方。
③百分位数、四分位数和四分位间距:百分位数(Percentile)是一种位置指标,用 P x Px Px来表示。
④变异系数(Coefficient of Variation):当需要比较两组数据的离散程度大小时,就可以用CV来表示,通过用均数大小进行标准化之后,CV就没有量纲了,就可以比较客观的比较大小了。

3.分布特征、其他趋势的描述指标

①偏度(Skewness):用来描述变量取之分布形态的统计量,指分布不对称的方向和程度。样本的偏度系数为 g 1 g_1 g1,偏度是与正态分布相比较而言的统计量。 g 1 > 0 g_1>0 g1>0分布为正偏或者右偏,即长尾在右,峰尖偏左; g 1 < 0 g_1<0 g1<0分布为负偏或左偏; g 1 = 0 g_1=0 g1=0分布为对称状态。
②峰度(Kurtosis):用来描述便利那个取值分布形态陡缓程度的统计量,是指分布图形的尖峭程度或峰凸程度。样本的峰度系数记为 g 2 g_2 g2。峰度也是与正态分布相比较而言的统计量, g 2 > 0 g_2>0 g2>0即峰的形状比较尖, g 2 < 0 g_2<0 g2<0即形状比正态分布平坦。 g 2 = 0 g_2=0 g2=0分布为正态峰。

4.假设检验的基本原理

①小概率事件的概念

  在讨论假设检验的基本思想之前,首先需要明确小概率事件这一概念。衡量一个事件发生与否的可能性的标准用概率来表示,通常概率大的事件容易发生,概率小的事件不容易发生。习惯上将发生概率很小,比如P≤0.05的事件称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,因此如果只进行一次试验,可以视为不会发生。

②小概率反证法原理

  假设检验的基本思想是统计学的“小概率反证法”原理:对一个小概率事件而言,其对立面发生的可能性显然要大大高于这一小概率事件,可以认为小概率事件在一次试验中不应当发生。因此可以假定需要考察的假设是成立的,然后基于此进行推导,计算在该假设所代表的总体中进行抽样研究,得到当前样本(及更极端样本)的概率是多少。如果结果显示这是一个小概率事件,则意味着如果假设成立,则在一次抽样研究中竟然就发生了小概率事件!这显然违反了小概率原理,因此可以按照反证法的思路推翻所给出的假设,认为它们实际上是不成立的,这就是小概率反证法原理。

③3.假设检验的标准步骤

根据大量的实践经验,假设检验的步骤一般可以归纳如下:
(1)建立假设。根据问题的需要提出原假设Ho,以及其对立面备选假设H1。
(2)确立检验水准。设立小概率事件的界值,称为c水准。这一步一般非常简单,习惯上会使用0.05作为界值。
(3)进行试验。得到用于统计分析的样本,并以该试验的结果作为假设检验的根据。
(4)选定检验方法,计算检验统计量。所谓各种假设检验方法,其主要差异之一就是所使用的统计量并不相同,但其应用目的却都是一致的,即通过统计量的概率分布得到P值。
(6)确定P值,做出推断结论。这里的P值对应的是当原假设Ho成立时,进行试验得到现有样本这种情况,以及比现有样本情况更极端的情形的累计概率。当P值小于或等于检验水准a时,意味着小概率事件A在一次试验中发生了,这与小概率事件实际不应该发生的原理相矛盾,从而推翻原假设Ho,接受其对立面H1;反之,若P值大于a,则找不到任何理由来推翻原假设,因此最终的结论只能是不能拒绝无效假设,这等于什么也没说!当然,从实用的角度出发,在检验所得到的概率值非常大时,研究者往往会将结果引申为接收 H 0 H_0 H0,但这仅仅是一个引申,和统计学已经无关了。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值