心理统计学笔记 (四) 检验

最新推荐文章于 2022-09-16 23:03:30 发布

Varalpha

最新推荐文章于 2022-09-16 23:03:30 发布

阅读量1.2k

点赞数

分类专栏： # 心理学统计文章标签：统计学

本文链接：https://blog.csdn.net/varalpha/article/details/109959700

版权

心理学统计专栏收录该内容

2 篇文章 3 订阅

订阅专栏

主目录

文章目录

四. 检验
五. 分析

参考心理统计视频，心理统计视频

四. 检验

4.1. 假设检验 hypothesis testing

通过对样本统计量的差异做出一般性结论，判断总体参数之间是否纯在差异，这种推论过程称作 假设检验。

参数检验: 总体分布已知，需要对总体的 未知参数 做假设检验。
- $Z, t, F$ 对于连续数据
非参数检验: 总体分布知之甚少，对总体 函数形态与特征 进行假设检验。
- $x^2$ , 非参检验对于离散数据。

4.1.1. 两类假设 $H_0, H_1$

备择（研究）假设 $H_1$ alternative hypothesis
- 定义：实验人员希望证实的假设
- 性质：假设两个总体参数之间 ( $\mu_1 \neq \mu_2$ )，或
  样本统计量 $\bar{X}$ 与总体参数 $\mu_0$ 之间 ( $\bar{X} \neq \mu_0 \to \mu_1 \neq \mu_0$ ) 存在真实差异，是一种有差假设。
- 表达方式：
  $\begin{aligned} H_1 : \begin{cases} \mu_1 \neq \mu_0 \\ \mu_1 \neq \mu_2 \end{cases}\end{aligned}$
虚无假设 $H_0$ null hypothesis
- 定义：研究人员为了证明研究假设为真通过利用概率论的反证法所进行的假设
- 性质：假设两个总体参数之间 ( $\mu_1 = \mu_2$ )，或
  样本统计量 $\bar{X}$ 与总体参数 $\mu_0$ 之间 ( $\bar{X} = \mu_0 \to \mu_1 = \mu_0$ ) 不存在真实差异，其存在表面差异为抽样造成的误差，是一种无差假设，又称零假设或原假设。
- 表达方式：
  $\begin{aligned} H_0 : \begin{cases} \mu_1 = \mu_0 \\ \mu_1 = \mu_2 \end{cases}\end{aligned}$

4.1.2. 显著性水平 significant level

含义

含义: 指拒绝虚无假设 $H_0$ (零假设) 而设定的小概率值。

与假设关系

零假设与显著性水平关系：
1. 如果零假设正确的可能性只有5%或1%，我们就排除零假设 $H_0$ 。这种临界概率就称为 显著性水平。
  $\begin{aligned} \alpha = \begin{cases} 0.05 \ (5\%) \\ 0.01 \ (1\%) \end{cases} \end{aligned}$
2. 通过判断显著性水平可以判断是否接受零假设 $H_0$ 。
  $H_0 : \bar{X} = \mu_0 \to \mu_1 = \mu_0$

单双侧检验

双侧检验：只强调差异，不管方向
- $H_1 : \mu_1 \neq \mu_0$
- 一侧 $\alpha/2$
单侧检验：强调差异，也强调方向
- 右侧： $H_0: \mu_1 \leq \mu_0, \ H_1: \mu_1 > \mu_0$
- 左侧： $H_0: \mu_1 \geq \mu_0, \ H_1: \mu_1 < \mu_0$

接受与拒绝域

接受域与拒绝域 rejection/critical region
- 5% 的显著性水平时，在标准正态分布上对应的 $z$ 值为 $±1.96 \pm 1.96$ , 所以
- 接受域 : $[- 1.96, 1.96]$
  - $\bar{X} = \mu_0 \to H_0: \mu_1 = \mu_0$
- 拒绝域 : $[-\infty, -1.96] \text{ or } [1.96, \infty]$
  - $\bar{X} = \mu_0 \to H_1: \mu_1 \neq \mu_0$

知乎有篇比较详细的解释
接受域与拒绝域

接受域与拒绝域

Type I, II Error

两类错误：
1. $\alpha$ or Type I Error 又叫做弃真错误。
  原假设 $H_0$ 实际上是正确的，但通过样本估计总体后，检验值进入了拒绝虚无假设 $H_0$ 的区域，致使做出拒绝原假设的结论。
  $\displaystyle\alpha \to \underbrace{H_0: \mu_1 = \mu_0}_{False} \to \underbrace{H_1 : \mu_1 \neq \mu_0 (1-\beta)}_{True}$
2. $\beta$ or Type II Error 又叫做取伪错误
  原假设 $H_0$ 实际上是不正确，但通过样本估计总体后，检验值进入了接受虚无假设 $H_0$ 的区域，致使做出接受原假设的结论，说明事物之间没有显著差异。
  $\displaystyle\beta \to \underbrace{H_1: \mu_1 \neq \mu_0}_{False} \to \underbrace{H_0 : \mu_1 = \mu_0 (1-\alpha)}_{True}$

$H_0$	Accepted $H_0$	Rejected $H_0$
$H_0$ True	TRUE $(1-\alpha)$	Type I error
$H_0$ False	Type II error	TRUE $(1-\beta)$

$\alpha, \beta$ 为拒绝 $H_0, H_1$ 所要付出的代价。
由于放弃真错误的概率被规定的显著性水平更容易控制，可以将错误影响降到最小，所以一般都是想要拒绝的假设。

错误关系

$\alpha + \beta \neq 1$
- $\alpha$ 为拒绝原假设 $H_0$ 时犯错误的概率，前提为 $H_0$ 为真。
- $\beta$ 为接受原假设 $H_0$ 时犯错误的概率，前提为 $H_0$ 为伪。
$\alpha \uparrow {\color{red} \nrightarrow } \ \beta \uparrow$ 两个无法同时增大与减小
- $\alpha \downarrow \rightarrow \beta \uparrow$
- $\alpha \uparrow \rightarrow \beta \downarrow$

Error Type

统计检测力（统计功效）statistical power: $1-\beta$

Statistical Power 的影响因素

统计检测力（统计功效）: $1-\beta$
- $(1-\beta)$ 为 $H_1: \mu_1 \neq \mu_0$ 的概率。

$\alpha$
- 大小
- 单双侧
$n$ 样本抽样容量 size of particular group
- $n\uparrow \to \sigma_{\bar{x}}\downarrow = \frac{\sigma}{\sqrt{n}\uparrow}\to \alpha\downarrow, \beta\downarrow \to (1-\beta)\uparrow$
处理效应 $\mu_1 - \mu_0$

1-beta

4.1.3. 平均数的显著性检验方法

假设检验步骤

提出假设：原假设和备择假设（三选一）
确定适当的统计检测量 (Z 已知参数$, t 未知参数)
指定检验中的显著性水平 $\alpha$
利用显著性水平，建立拒绝 $H_0$ 原则
计算样本统计量的值
做出统计决策
- 将检验统计量的值与拒绝规则所指定的零界值比较，确定是否拒绝原假设。
- 由检验统计量计算 $p$ 值,利用 $p$ 值确定是否拒绝原假设。

总结

平均数的显著性检验：指检验的一个样本均数 $\bar{x}$ 与相应总体均数 $\mu_1$ 之差。
Z 检验：总体方差 $\alpha^2$ 已知
1. $\displaystyle Z = \frac{\bar{x}-\mu_0}{\sigma_{\bar{x}}}, \ \sigma_{\bar{x}} = \frac{\sigma_0}{\sqrt{n}}$
2. $\begin{aligned}\displaystyle\alpha \begin{cases} 0.05 \ \to \ Z _\frac{\alpha}{2} = 1.96 ， \ Z _\alpha = 1.64 \\ 0.01 \ \to \ Z _\frac{\alpha}{2} = 2.58， \ Z _\alpha = 2.33 \end{cases} \end{aligned}$
t 检验：总体方差 $\alpha^2$ 未知
1. $\displaystyle Z = \frac{\bar{x}-\mu_0}{\sigma_{\bar{x}}}, \ \sigma_{\bar{x}} = \frac{S}{\sqrt{n-1}}$
2. $\begin{aligned}\displaystyle df=n-1, \alpha \begin{cases} 0.05 \ \to \ t_\frac{\alpha}{2}，t_\alpha \\ 0.01 \ \to \ t_\frac{\alpha}{2}，t_\alpha \end{cases} \end{aligned}$
3. $\to t \approx Z$

4.1.4. 平均数差异的显著性检验

当两个总体均值都未知时 ( $\mu_1=?, \mu_2=?$ )，通过各抽取 $n_1, n_2)$ 个样本，获取平均数 $\bar{x_1}, \bar{x_2}$ 。分析关系 $\bar{x_1} \neq \bar{x_2}$ ，推断出 $\mu_1 \neq \mu_2$ 。

Z 检验步骤

建立假设:
$H_0: \mu_1 = \mu_2, \ H_1:\mu_1 \neq \mu_2$
计算标准误:
- 独立样本:
  $SE_{D_{\bar{x}}} = \displaystyle\sqrt{\frac{\sigma_1^2}{n_1}+ \frac{\sigma_2^2}{n_2}}$
- 相关样本 (相关系数 $r$ ):
  $SE_{D_{\bar{x}}} = \displaystyle\sqrt{\frac{\sigma_1^2}{n_1}+ \frac{\sigma_2^2}{n_2} - 2r \frac{\sigma_1}{\sqrt{n}}\frac{\sigma_2}{\sqrt{n}} }$
计算样本统计量:
$\displaystyle \frac{\bar{X_1} - \bar{X_2}}{SE_{D_{\bar{x}}}}$
比较，做出决策

t 检验步骤

建立假设:
$H_0: \mu_1 = \mu_2, \ H_1:\mu_1 \neq \mu_2$
计算标准误（Standard Error of Mean）:
- 独立样本，方差齐性 :
  $S_P^2 = \displaystyle\sqrt{\frac{n_1 s_1^2 + n_2 s^2_2}{n_1+ n_2 -2}}$
  $SE_{D_{\bar{x}}} = \displaystyle\sqrt{S_P^2(\frac{1}{n_1} + \frac{1}{n_2})}$
- 独立样本，方差 不齐性 : $\cdots$
- 相关样本 (相关系数 $r$ 已知 ): $\cdots$
- 相关样本 (相关系数 $r$ 未知 ): $\cdots$
计算样本统计量:
$\displaystyle \frac{\bar{X_1} - \bar{X_2}}{SE_{D_{\bar{x}}}}， df = n_1 + n_2 - 2$
比较，做出决策