面试模拟场景
面试官: 你能解释一下什么是假设和检验吗?
参考回答示例
1. 假设(Hypothesis)
定义:
- 假设 是一种关于总体参数的声明或猜测。假设可以是关于总体均值、方差、比例等参数的。假设通常分为两类:
- 原假设(Null Hypothesis, H 0 H_0 H0): 原假设是一种被认为正确的假设,通常表示没有效果或没有差异。
- 备择假设(Alternative Hypothesis, H 1 H_1 H1): 备择假设是与原假设相对立的假设,表示存在效果或差异。
例子:
- 例如,在药物测试中,原假设 H 0 H_0 H0 可以是“药物对治疗疾病没有效果”,而备择假设 H 1 H_1 H1 可以是“药物对治疗疾病有效”。
2. 检验(Test)
定义:
- 检验 是一种统计方法,用于评估样本数据是否为支持或反驳原假设提供了足够的证据。通过检验,我们可以决定是否拒绝原假设。检验通常包括以下几个步骤:
- 设定假设: 明确原假设 H 0 H_0 H0 和备择假设 H 1 H_1 H1。
- 选择检验统计量: 根据问题的性质选择适当的统计量,例如 t统计量、z统计量或卡方统计量。
- 设定显著性水平( α \alpha α): 通常选择 α = 0.05 \alpha = 0.05 α=0.05 或 α = 0.01 \alpha = 0.01 α=0.01,表示我们有多大概率允许犯错。
- 计算p值或临界值: 使用样本数据计算出统计量的p值,或者与临界值比较。
- 做出决策: 根据p值或临界值决定是否拒绝原假设。如果p值小于显著性水平 α \alpha α,我们拒绝原假设,否则我们不拒绝原假设。
例子:
- 在进行药物实验时,我们可能会使用t检验来判断新药和安慰剂组患者的平均恢复时间是否有显著差异。
3. 假设检验的概念
1. p值(p-value):
- 定义: p值是指在原假设为真的前提下,观察到的样本数据或更极端数据出现的概率。p值越小,表示观察到的结果与原假设越不一致,因此我们更倾向于拒绝原假设。
- 解释: 如果p值小于我们设定的显著性水平(如0.05),我们拒绝原假设,认为数据提供了足够的证据支持备择假设。
2. 显著性水平( α \alpha α):
- 定义: 显著性水平是我们预先设定的一个阈值,用于判断p值是否足够小,通常设定为0.05或0.01。它表示在假设检验中我们可以接受的犯第一类错误(拒绝原假设而实际上原假设为真)的概率。
- 解释: 如果p值小于显著性水平 α \alpha α,我们认为结果显著,拒绝原假设。
3. 第一类错误和第二类错误:
- 第一类错误(Type I Error): 拒绝原假设而实际上原假设为真。
- 第二类错误(Type II Error): 不拒绝原假设而实际上原假设为假。
4. 假设检验的应用
1. 医学研究:
- 假设检验常用于判断新药是否比现有药物更有效,或某种治疗方法是否有显著的疗效。
2. 工程和制造:
- 假设检验用于检测产品质量是否符合标准。例如,判断生产线上制造的零件是否符合规格。
3. 社会科学:
- 在社会科学研究中,假设检验用于验证社会行为、心理实验等的显著性,例如判断不同教育方法对学生成绩的影响。
5. 总结
- 假设: 假设是关于总体参数的声明,分为原假设和备择假设。原假设通常表示无差异或无效果,而备择假设表示有差异或有效果。
- 检验: 检验是通过样本数据对假设进行验证的过程。它涉及到选择统计量、设定显著性水平、计算p值,并根据结果做出是否拒绝原假设的决策。