SPASS-参数估计与假设检验

最新推荐文章于 2024-05-30 16:17:47 发布

世润

最新推荐文章于 2024-05-30 16:17:47 发布

阅读量3.3k

点赞数

分类专栏： SPASS学习专栏文章标签：算法数据分析人工智能机器学习 spass

本文链接：https://blog.csdn.net/u012994320/article/details/134451501

版权

SPASS学习专栏专栏收录该内容

18 篇文章 7 订阅

订阅专栏

参数估计

点估计

点估计用样本统计量的值直接作为总体参数的估计值。如用样本均值直接作为总体均值的估计值，用样本方差直接作为总体方差的估计值等。

常用的点估计法

（1）矩估计法（2）极大似然估计法（3）稳健估计法

区间估计

因为点估计直接用样本估计值作为总体参数的估计值，没有提供关于估计精度的任何信息，存在抽样标准误差，故提出了未知参数的区间估计法。

给出两个数，指出总体参数以一定概率位于两数所确定的区间内，这种估计叫做参数的区间估计。区间估计是在点估计的基础上，给出总体参数估计的一个范围，所以区间估计相对于点估计更加精确，要优于点估计。

假设检验

统计假设

原假设

被检验的假设，通过检验可能被接受，也可能被否定；在很多情况下，我们给出一个统计假设仅仅是为了拒绝它。例如，如果我们要判断给定的一枚硬币是否均匀，则假设硬币是均匀的（即p=0.5，其中p是正面出现的概率）；类似地，如果我们要判断一种方法是否优于其他的方法，则假设两种方法之间没有差异。这样的假设通常称为零假设或原假设。记为：

备择假设

与原假设对应的假设，只有在原假设被否定后才可接受的假设；例如，如果零假设是，则备择假设是。备择假设记为

拒绝域、临界点

当检验统计量取某个区域中的值时，拒绝原假设，则称该取值区域为拒绝域，称拒绝域的边界点为临界点。

显著性水平与置信水平

显著性水平

在作假设检验时，我们犯第一类错误的最大概率称为检验的显著性水平。这个概率常记为，通常抽样前就指定好，这样得到的结果才不会影响我们的选择。在实际问题中，显著性水平可以有多种选择，但最为普通的是0.05或0.01。例如，如果设计一个决策法则选择的显著性水平是0.05（5%），那么在100次中可能有5次机会使我们拒绝本该接受的假设。也就是说，我们大约有95%的把握作出正确的决策。此时，我们说拒绝假设的显著性水平为0.05，即犯拒绝本应接受的假设这类错误的概率是0.05。

置信水平

1- 为置信度或置信水平；

假设检验的两类错误

第一类错误：在假设检验中拒绝了本来是正确的原假设。

第二类错误：在假设检验中没有拒绝错误的原假设。

概率P值

P值是当原假设正确时，观测到的样本信息出现的概率。通常用P值与预先设定的显著性水平值比较，若P值小于显著性水平，则认为该概率值足够小，应拒绝原假设。

单侧检验与双侧检验

双侧检验

只强调差异而不强调方向性的检验叫双侧检验。

单侧检验

强调某一方向的检验叫单侧检验。

小概率事件原理

在概率论中我们把发生概率小到接近于0的事件称为小概率事件（即在大量重复试验中出现的频率非常低）。在统计学上，把小概率事件看成在一次特定的抽样中不可能发生的事件，称为“小概率事件实际不可能原理”。这是统计学上进行假设检验（显著性检验）的基本依据。根据这一原理，若某事件在理论上被认为在原假设成立的情况下是个小概率事件，它不会出现，而在实际中出现了，我们就推翻原来的假设，认为原假设不成立，从而接受备择假设。

假设检验的一般步骤

第1步给出检验问题的原假设；

根据检验问题的要求，将需要检验的最终结果作为零假设。例如，需要检验某学校的高考数学平均成绩是否同往年的平均成绩一样，都为75,由此可做出零假设

第2步选择检验统计量；

在统计推断中，总是通过构造样本的统计量并计算统计量的概率值进行推断，一般构造的统计量应服从或近似服从常用的已知分布，例如均值检验中最常用的t分布和F分布等。

第3步规定显著性水平;

第4步计算检验统计量的观测值及其发生的概率值；

在给定零假设前提下，计算统计量的观测值和相应概率p值。概率p值就是在零假设成立时检验统计量的观测值发生的概率，该概率值间接地给出了样本值在零假设成立的前提下的概率，对此可以依据一定的标准来判断其发生的概率是否为小概率。

第5步在给定显著性水平条件下，做出统计推断结果。

这里的显著性水平指的是当假设正确时被拒绝的概率，即弃真概率，一般取0.01或0.05。当检验统计量的概率p值小于显著性水平时，则认为此时拒绝零假设而犯弃真错误的概率小于显著性水平，即低于预先给定的水平，也就是说犯错误的概率小到我们能容忍的范围，这时可以拒绝零假设；反之，如果检验统计量的概率p值大于显著性水平，如果拒绝零假设，犯弃真错误的概率大于预先给定的容忍水平，这时不应该拒绝零假设。

参数检验

参数检验的总体分布形式是已知的或假定的，只是一些参数的取值或范围未知，分析的主要目的是估计参数的取值范围，或对其进行某种统计检验。如正态总体的均值是否与某个值存在显著差异，两个总体的均值是否有显著差异等。主要包括: ① 单样本T检验：检验单个变量的均值与假设检验值之间是否存在差异； ② 独立样本T检验：检验两组来自独立总体的样本，其独立总体的均值或中心位置是否一样； ③ 配对样本T检验：检验两个相关的样本是否来自具有相同均值的总体。

非参数检验简介

非参数检验是在总体分布未知的情况下，利用样本数据对总体分布形态等进行推断的方法，在推断过程中不涉及有关总体分布的参数，而是检验总体某些有关的性质，如总体的分布位置、分布形状之间的比较等。

与参数检验的原理相同，非参数检验过程也是先根据问题提出原假设，然后利用统计学原理构造出适当的统计量，最后利用样本数据计算统计量的概率P值，与显著性水平进行比较，得出拒绝或者接受原假设的结论。

非参数检验包括单样本（O）、独立样本（I）、相关样本（R）的非参数检验。

参数检验及非参数检验比较

参数检验和非参数检验最本质的区别是：参数检验需要事先确定或假定总体的分布，非参数检验则不需要假定总体的分布，而是直接用样本来推断总体的分布。除此之外，二者之间还可以从很多方面来区分。研究的对象和目标不同。研究的统计量有所不同。

单样本T检验

单样本T检验利用来自某总体的样本数据，推断该总体的均值与指定的检验值之间是否存在显著性差异，它是对总体均值的假设检验。为此，给出检验均值，原假设： = ，其中为总体均值，即认为总体均值与检验值之间无显著性差异。

单样本T检验的检验统计量

单样本T检验的前提是总体服从正态分布，其中为总体均值，为总体方差。如果样本容量为n,样本均值为，则仍服从正态分布，即：。在零假设成立的条件下，均值检验使用t统计量，构造的t统计量为：其中，用代入，t统计量服从自由度为n-1的t分布，S为样本标准差。在给定原假设的前提下，SPSS将检验值代入t统计量，得到检验统计量观测值，以及根据T分布的分布函数计算出的概率P值。

世润

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
SPASS-参数估计与假设检验

非参数检验是在总体分布未知的情况下，利用样本数据对总体分布形态等进行推断的方法，在推断过程中不涉及有关总体分布的参数，而是检验总体某些有关的性质，如总体的分布位置、分布形状之间的比较等。与参数检验的原理相同，非参数检验过程也是先根据问题提出原假设，然后利用统计学原理构造出适当的统计量，最后利用样本数据计算统计量的概率P值，与显著性水平进行比较，得出拒绝或者接受原假设的结论。非参数检验包括单样本（O）、独立样本（I）、相关样本（R）的非参数检验。
复制链接

扫一扫