统计学假设检验方法简单介绍

安宁ᨐ

于 2024-01-15 00:00:00 发布

阅读量846

点赞数 8

文章标签： python 数学建模

本文链接：https://blog.csdn.net/weixin_71158509/article/details/135557758

版权

统计学的假设检验方法有以下几种：

1. 单样本 t 检验：用于检验一个样本均值是否与给定的理论值相等。

2. 独立样本 t 检验：用于比较两个独立样本的均值是否相等。

3. 配对样本 t 检验：用于比较同一组样本的两个相关变量的均值是否相等。

4. 卡方检验：用于检验观察频数与理论频数之间是否存在显著差异。

5. 方差分析：用于比较多个样本均值是否相等。

6. 二项式检验：用于检验两个二项分布之间的差异。

7. Wilcoxon 符号秩检验：用于比较两个相关样本的中位数是否相等。

8. Mann-Whitney U 检验：用于比较两个独立样本的中位数是否相等。

9. Kruskal-Wallis H 检验：用于比较多个独立样本的中位数是否相等。

10. Friedman 秩和检验：用于比较同一组样本的多个相关变量的中位数是否相等。

假设检验是统计学中常用的方法之一，可以帮助我们判断样本数据是否支持某个假设，并在科学研究、市场调查、医学实验等领域中起到重要的作用。

独立性假设在统计分析中是难以验证的，通常是在实际问题中假设满足独立性，并进行分析。正态分布假设通常可以通过观察数据的分布情况来初步判断，也可以通过一些统计方法来检验，如Shapiro-Wilk检验或Kolmogorov-Smirnov检验。方差齐性假设可以使用Levene检验或Bartlett检验进行检验。

以下是Python中使用相关代码进行正态分布和方差齐性检验的示例：

```python
import numpy as np
from scipy.stats import shapiro, bartlett

# 正态分布检验
data = np.random.normal(loc=0, scale=1, size=100)  # 生成正态分布数据
statistic, p_value = shapiro(data)
print('Shapiro-Wilk正态分布检验结果：')
print('Statistic:', statistic)
print('p-value:', p_value)

# 方差齐性检验
group1 = np.random.normal(loc=0, scale=1, size=50)
group2 = np.random.normal(loc=0, scale=1, size=50)
statistic, p_value = bartlett(group1, group2)
print('Bartlett方差齐性检验结果：')
print('Statistic:', statistic)
print('p-value:', p_value)
```

注意：以上示例仅展示了一种方法来进行正态分布和方差齐性检验，实际问题中可能需要根据具体情况选择适宜的检验方法。另外，还可以使用其他统计软件进行检验，如R语言中的相关函数。

1. 单样本 t 检验案例：
假设我们想要检验一家公司员工的平均工资是否等于5000元。我们收集了30个员工的工资数据，并进行单样本 t 检验。代码实现（使用 Python 的 SciPy 库）：

```python
import numpy as np
from scipy import stats

# 员工工资数据
salaries = [4000, 4200, 4100, 4300, 4500, 4800, 5200, 5300, 4800, 4900,
            5100, 5000, 4900, 5000, 4800, 5300, 5200, 5100, 5200, 5100,
            5500, 5000, 5000, 5500, 5400, 5200, 5000, 4800, 4700, 4600]

# 进行单样本 t 检验
t_statistic, p_value = stats.ttest_1samp(salaries, 5000)

print("t-statistic:", t_statistic)
print("p-value:", p_value)
```

2. 独立样本 t 检验案例：
假设我们想要比较两个班级的学生数学成绩是否有显著差异。我们收集了两个班级各自的学生数学成绩数据，并进行独立样本 t 检验。代码实现（使用 Python 的 SciPy 库）：

```python
import numpy as np
from scipy import stats

# 班级 A 的学生数学成绩数据
class_a_scores = [80, 85, 90, 75, 95, 85, 80, 90, 88, 92]

# 班级 B 的学生数学成绩数据
class_b_scores = [70, 75, 80, 65, 85, 75, 70, 80, 78, 82]

# 进行独立样本 t 检验
t_statistic, p_value = stats.ttest_ind(class_a_scores, class_b_scores)

print("t-statistic:", t_statistic)
print("p-value:", p_value)
```

3. 配对样本 t 检验案例：
假设我们想要比较一组学生的语文成绩和数学成绩是否有显著差异。我们收集了这组学生的语文成绩和数学成绩数据，并进行配对样本 t 检验。代码实现（使用 Python 的 SciPy 库）：

```python
import numpy as np
from scipy import stats

# 学生的语文成绩数据
chinese_scores = [80, 85, 90, 75, 95]

# 学生的数学成绩数据
math_scores = [70, 75, 80, 65, 85]

# 进行配对样本 t 检验
t_statistic, p_value = stats.ttest_rel(chinese_scores, math_scores)

print("t-statistic:", t_statistic)
print("p-value:", p_value)
```

这些代码实现了统计学的假设检验方法的一些案例，通过计算 t 统计量和 p 值来得出结论。需要注意的是，这些案例中的数据仅用于示范，实际应用时需要根据具体情况使用真实的数据。

以下是这几种方法在Python中的代码示例：

卡方检验（使用scipy库）：

from scipy.stats import chi2_contingency

observed = [[10, 15, 20], [30, 25, 20]]
chi2, p_value, _, _ = chi2_contingency(observed)

print("Chi-square statistic:", chi2)
print("p-value:", p_value)

方差分析（使用statsmodels库）：

import statsmodels.api as sm
from statsmodels.formula.api import ols

data = pd.read_csv("data.csv")  # 读取数据
model = ols('outcome_variable ~ group_variable', data=data).fit()
anova_result = sm.stats.anova_lm(model)

print(anova_result)

二项式检验（使用scipy库）：

from scipy.stats import binom_test

p1 = 0.4
n1 = 100
x1 = 35

p2 = 0.5
n2 = 100
x2 = 45

p_value = binom_test(x1, n1, p1) + binom_test(x2, n2, p2)

print("p-value:", p_value)

Wilcoxon 符号秩检验（使用scipy库）

from scipy.stats import wilcoxon

data1 = [20, 25, 30, 35, 40]
data2 = [15, 20, 25, 30, 35]

statistic, p_value = wilcoxon(data1, data2)

print("Wilcoxon statistic:", statistic)
print("p-value:", p_value)

Mann-Whitney U 检验（使用scipy库）：

from scipy.stats import mannwhitneyu

data1 = [20, 25, 30, 35, 40]
data2 = [15, 20, 25, 30, 35]

statistic, p_value = mannwhitneyu(data1, data2)

print("Mann-Whitney U statistic:", statistic)
print("p-value:", p_value)

Kruskal-Wallis H 检验（使用scipy库）：

from scipy.stats import kruskal

data1 = [20, 25, 30, 35, 40]
data2 = [15, 20, 25, 30, 35]
data3 = [10, 15, 20, 25, 30]

statistic, p_value = kruskal(data1, data2, data3)

print("Kruskal-Wallis H statistic:", statistic)
print("p-value:", p_value)

Friedman 秩和检验（使用scipy库）

from scipy.stats import friedmanchisquare

data = [[10, 20, 30], [15, 25, 35], [20, 30, 40]]

statistic, p_value = friedmanchisquare(*data)

print("Friedman chi-square statistic:", statistic)
print("p-value:", p_value)

请注意，这只是提供了一个基本的代码框架示例，你需要根据你的具体数据和假设进行适当的调整。另外，你可能还需要导入其他必要的库和处理数据的步骤。

安宁ᨐ

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
统计学假设检验方法简单介绍

需要注意的是，这些案例中的数据仅用于示范，实际应用时需要根据具体情况使用真实的数据。请注意，这只是提供了一个基本的代码框架示例，你需要根据你的具体数据和假设进行适当的调整。假设检验是统计学中常用的方法之一，可以帮助我们判断样本数据是否支持某个假设，并在科学研究、市场调查、医学实验等领域中起到重要的作用。10. Friedman 秩和检验：用于比较同一组样本的多个相关变量的中位数是否相等。3. 配对样本 t 检验：用于比较同一组样本的两个相关变量的均值是否相等。5. 方差分析：用于比较多个样本均值是否相等。
复制链接

扫一扫