12.5 T检验基本原理

最新推荐文章于 2025-05-22 16:25:30 发布

Debugging 我的人生

最新推荐文章于 2025-05-22 16:25:30 发布

阅读量843

点赞数 16

分类专栏：数学基础文章标签：回归数据挖掘人工智能概率论机器学习

本文链接：https://blog.csdn.net/Leroi64/article/details/148080923

版权

115 篇文章

订阅专栏

T检验的本质
T检验是一种基于t分布的假设检验方法，主要用于小样本（通常 $n < 30$ ）或总体标准差未知时，判断样本均值与总体均值是否存在显著差异，或两独立样本均值是否不同。其核心逻辑是通过计算标准化后的统计量（t值），判断其是否超出预设的临界值范围。
适用条件：
- 小样本（ $n < 30$ ）或总体标准差未知
- 数据近似正态分布（可通过Q-Q图或夏皮罗-威尔克检验验证）
- 独立性假设：样本间无相互影响

单样本T检验公式：
$\frac{\bar{X} - \mu}{s / \sqrt{n}}$
其中：
- $\bar{X}$ ：样本均值
- $\mu$ ：假设的总体均值
- $s$ ：样本标准差
- $n$ ：样本量
自由度（Degrees of Freedom）：
自由度 $v = n - 1$ ，反映样本中可自由变动的数据量。例如样本量为35时，自由度 $v = 34$ ，代表前34个数据可任意变化，第35个数据需固定以满足均值约束。
临界值与拒绝域：
- 根据显著性水平 $\alpha$ 和自由度查t分布表（如 $\alpha=0.05$ ，双侧检验临界值为 $t_{\alpha/2, v}$ ）
- 若 $t_{\alpha/2, v}$ （双侧）或 $t_{\alpha, v}$ （单侧），则拒绝原假设 $H_0$ 。

小概率反证法：
- 假设原假设 $H_0$ 成立（如 $\mu = 10$ ），计算当前数据出现的概率 $P$ 。若 $\alpha$ （如 $P = 0.01$ ），则说明数据与 $H_0$ 矛盾，支持备择假设 $H_1$ 。
- 显著性水平 $\alpha$ ：人为设定错误拒绝 $H_0$ 的风险阈值（常用 $\alpha=0.05$ ）。
两类错误控制：
- 第一类错误（弃真）：错误拒绝 $H_0$ （如健康人误诊为患病），概率为 $\alpha$ 。
- 第二类错误（取伪）：错误接受 $H_0$ （如患者漏诊），概率为 $\beta$ ，需通过增大样本量降低。
检验力（Power）：
公式： $\text{Power} = 1 - \beta$ ，表示正确拒绝 $H_0$ 的能力。样本量越大，检验力越高。

医学试验：
- 案例：比较新药与安慰剂的疗效（单样本T检验）。
- 步骤：
  1. 设定 $H_0: \mu_{\text{新药}} = \mu_{\text{旧药}}$ ， $H_1: \mu_{\text{新药}} > \mu_{\text{旧药}}$ （单侧检验）
  2. 计算 $\frac{98.4 - 98.1}{0.2/\sqrt{35}} \approx 5.43$
  3. 查表得 $t_{0.05, 34} \approx 1.69$ ，因 $t > 1.69$ ，拒绝 $H_0$ ，支持新药效果更优。
质量控制：
- 案例：检验零件长度是否为10cm（双侧T检验）。
- 步骤：
  1. 设定 $H_0: \mu = 10$ ， $H_1: \mu \neq 10$
  2. 计算 $\frac{10.4 - 10}{0.2/\sqrt{35}} \approx 11.83$
  3. 查表得 $t_{0.025, 34} \approx 2.032$ ，因 $∣ t ∣ > 2.032$ ，拒绝 $H_0$ ，判定零件长度偏离标准。

误用场景：
- 非正态数据：对偏态分布数据强行使用T检验（应改用秩和检验）
- 大样本误用：样本量 $\geq 30$ 时仍用T检验（应改用Z检验）。
改进方法：
- 正态性验证：通过Q-Q图或夏皮罗-威尔克检验确保数据近似正态
- 功效分析：预先计算最小样本量，确保检验力 $1-\beta \geq 0.8$ 。

T检验就像“质检员的放大镜”：

小样本专用：
当工厂只抽检25个零件（样本小）时，T检验会考虑“抽样误差”，通过调整放大倍数（自由度 $n - 1$ ）避免误判。例如：
- 若样本均值10.4cm，标准差0.2cm，T检验会计算“偏离标准值多少倍标准差”（t值），而非直接套用固定阈值。
自由度意义：
自由度好比“质检员的可调整空间”——抽检25个零件时，前24个可自由测量，第25个必须按前24个的平均值反向推算，确保整体均值不变。
两类错误类比：
- 误判（假警报）：合格零件被误判为问题零件（ $\alpha=5\%$ 风险）。
- 漏检（放水）：问题零件未被检出（需增加抽检数量降低风险）。