统计显著性检验与Python中的数据可视化-CSDN博客

本文链接：https://blog.csdn.net/weixin_33773084/article/details/147473456

统计显著性检验与Python中的数据可视化

在数据分析领域，确定数据集中变量之间的关系是否具有统计学上的显著性是至关重要的。本章内容深入探讨了如何利用Python来进行这种分析，并通过具体案例演示了统计检验的实际应用。

曼-惠特尼检验

曼-惠特尼检验是用于检验两个独立样本中位数差异是否统计显著的非参数检验方法。本章通过一个实例，使用了Python的NumPy库和 mannwhitneyu 函数来计算中位数和p值。

import numpy as np
from scipy.stats import mannwhitneyu

headezine = np.array([4, 2, 6, 2, 3, 5, 7, 8])
kabezine = np.array([8, 7, 5, 10, 6, 9, 8])

U, p = mannwhitneyu(headezine, kabezine)
print(f'stat = {U:.4f}, p-value= {p:.4f}')

在上述代码中，我们对 headezine 和 kabezine 两组数据进行了曼-惠特尼检验，得到了统计量U和p值。当p值小于α（通常为0.05）时，我们可以拒绝零假设，即认为两组数据的中位数存在显著差异。

配对样本t检验

配对样本t检验是另一种重要的统计检验方法，特别适用于比较同一组样本在两个不同条件下的结果。本章通过一个星际舰队志愿者的例子，展示了一个配对样本t检验的Python实现：

from scipy.stats import ttest_rel

pre = [...]  # 治疗前数据
post = [...]  # 治疗后数据

tstat, p = ttest_rel(pre, post)
print(f'stat = {tstat:.4f}, p-value= {p:.4f}')

在这里， ttest_rel 函数用于计算相关样本的t检验统计量和p值。这种方法适用于数据满足正态分布的情况。

Wilcoxon匹配对检验

当数据不满足正态分布的假设时，我们可以使用非参数的Wilcoxon匹配对检验作为替代。本章提供了使用 wilcoxon 函数进行非参数检验的示例：

from scipy.stats import wilcoxon

cerritos_pre = [...]  # 治疗前数据
cerritos_post = [...]  # 治疗后数据

tstat, p = wilcoxon(cerritos_pre, cerritos_post)
print(f'stat = {tstat:.4f}, p-value= {p:.4f}')

通过这些示例，我们可以看到，不同的数据类型和研究问题需要选择合适的统计检验方法。统计学不仅提供了分析数据的工具，还帮助我们在决策过程中运用科学的方法。