【Python・统计学】t检验（t検定）

TUTO_TUTO

已于 2024-04-06 12:30:56 修改

阅读量569

点赞数 6

分类专栏： python 统计学文章标签： python 学习笔记学习方法

于 2024-01-09 22:14:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TUTO_TUTO/article/details/135490471

版权

统计学同时被 2 个专栏收录

11 篇文章 5 订阅

订阅专栏

10 篇文章 1 订阅

订阅专栏

目录

1. 安装包/读取数据

2. 正态性检验（t检验的前提之一）

3.方差齐性检验（t检验的前提之二）

（1）非独立样本t检验（対応あり）

（2）独立样本t检验（対応なし）

（3）韦尔奇t检验（ウェルチ検定）-无法满足方差齐性的时候用

5.效果量（Cohen's d/Pearson's r）：后附效果量的指标

（1）非独立样本t检验效果量计算

（2）独立样本t检验效果量计算

（3）韦尔奇t检验效果量计算

*效果量大小的指标

1. 安装包/读取数据

pip install japanize-matplotlib #日语显示专用包，不需要日语的不用安装
import pandas as pd
import matplotlib.pyplot as plt
import japanize_matplotlib
from scipy import stats

# Excelファイルを読み込む
data = pd.read_excel('/content/ttest_data.xlsx')
print(data)

# 'test1'と 'test2'の列からデータを取得します
test1 = data['Test1']
test2 = data['Test2']

2. 正态性检验（t检验的前提之一）

正态性检验有很多种方法，其中最直观的是图示法。

本文分别用（1）图示法，（2）Shapiro-Wilk正規性検定两种方法来检验数据正态性

#（1）图示法
plt.figure(figsize=(12, 6))
plt.subplot(1, 2, 1)
plt.hist(test1, bins=30, color='green', alpha=0.6, edgecolor='black')
plt.title("test1のヒストグラム")
plt.xlabel("値")
plt.ylabel("頻度")
plt.subplot(1, 2, 2)
plt.hist(test2, bins=30, color='blue', alpha=0.6, edgecolor='black')
plt.title("test2のヒストグラム")
plt.xlabel("値")
plt.ylabel("頻度")
plt.tight_layout()

plt.show()

# （2） Shapiro-Wilk正規性検定
statistic1, p_value1 = stats.shapiro(test1)
statistic2, p_value2 = stats.shapiro(test2)

# 結果の出力
print("test1のShapiro-Wilk検定統計量:", statistic1)
print("test1のShapiro-Wilk検定p値:", p_value1)

print("test2のShapiro-Wilk検定統計量:", statistic2)
print("test2のShapiro-Wilk検定p値:", p_value2)

# p値を基に正規分布の帰無仮説を評価
alpha = 0.05  # 有意水準 (通常は0.05)
if p_value1 > alpha:
    print("test1は正規分布に従っています")
else:
    print("test1は正規分布に従っていません")

if p_value2 > alpha:
    print("test2は正規分布に従っています")
else:
    print("test2は正規分布に従っていません")

3.方差齐性检验（t检验的前提之二）

# 等分散性を検定
statistic, p_value = stats.levene(test1, test2)

# 結果の出力
print("Leveneの等分散性検定統計量:", statistic)
print("Leveneの等分散性検定p値:", p_value)

# p値を基に等分散性の帰無仮説を評価
alpha = 0.05  # 有意水準 (通常は0.05)
if p_value > alpha:
    print("等分散性の帰無仮説は棄却されません (等分散)")
else:
    print("等分散性の帰無仮説は棄却されます (非等分散)")

4．t检验

（1）非独立样本t检验（対応あり）

# 対応ありのt検定
t_statistic, p_value = stats.ttest_rel(test1, test2)

# 結果の出力
print("対応ありのt検定統計量:", t_statistic)
print("対応ありのt検定p値:", p_value)
alpha = 0.05  # 信頼水準 (通常は0.05)
df = len(test1) + len(test2) - 2  # 自由度
std_error = np.sqrt(np.var(test1)/len(test1) + np.var(test2)/len(test2))
margin_of_error = stats.t.ppf(1 - alpha/2, df) * std_error
conf_int = (t_statistic - margin_of_error, t_statistic + margin_of_error)
print("対応ありのt検定信頼区間：",conf_int)

（2）独立样本t检验（対応なし）

# 対応なしのt検定
t_statistic, p_value = stats.ttest_ind(test1, test2)

# 結果の出力
print("対応なしのt検定統計量:", t_statistic)
print("対応なしのt検定p値:", p_value)

alpha = 0.05  # 信頼水準 (通常は0.05)
df = len(test1) + len(test2) - 2  # 自由度
std_error = np.sqrt(np.var(test1)/len(test1) + np.var(test2)/len(test2))
margin_of_error = stats.t.ppf(1 - alpha/2, df) * std_error
conf_int = (t_statistic - margin_of_error, t_statistic + margin_of_error)
print("対応なしのt検定信頼区間：",conf_int)

（3）韦尔奇t检验（ウェルチ検定）-无法满足方差齐性的时候用

# ウェルチのt検定
t_statistic, p_value = stats.ttest_ind(test1, test2, equal_var=False)

# 結果の出力
print("ウェルチのt検定統計量:", t_statistic)
print("ウェルチのt検定p値:", p_value)
alpha = 0.05  # 信頼水準 (通常は0.05)
df = len(test1) + len(test2) - 2  # 自由度
std_error = np.sqrt(np.var(test1)/len(test1) + np.var(test2)/len(test2))
margin_of_error = stats.t.ppf(1 - alpha/2, df) * std_error
conf_int = (t_statistic - margin_of_error, t_statistic + margin_of_error)
print("ウェルチ検定の信頼区間：",conf_int)

5.效果量（Cohen's d/Pearson's r）：后附效果量的指标

（1）非独立样本t检验效果量计算

# 対応ありのt検定効果量
import numpy as np
t_statistic, p_value = stats.ttest_rel(test1, test2)

# Cohen's dの計算
mean_diff = np.mean(test1) - np.mean(test2)
pooled_std = np.sqrt(((len(test1) - 1) * np.var(test1, ddof=1) + (len(test2) - 1) * np.var(test2, ddof=1)) / (len(test1) + len(test2) - 2))
cohen_d = mean_diff / pooled_std

# 結果の出力
print("対応ありt検定の効果量Cohen's d:", cohen_d)

# Pearson's rの計算
correlation_coefficient, _ = stats.pearsonr(test1, test2)
# 結果の出力
print("対応ありt検定の効果量Pearson's r:", correlation_coefficient)

（2）独立样本t检验效果量计算

#対応なしのt検定効果量
mean1 = np.mean(test1)
mean2 = np.mean(test2)
std1 = np.std(test1, ddof=1)  # 不偏標準偏差
std2 = np.std(test2, ddof=1)

pooled_std = np.sqrt((len(test1) - 1) * std1**2 + (len(test2) - 1) * std2**2) / (len(test1) + len(test2) - 2)
d = (mean1 - mean2) / pooled_std
r, _ = stats.pearsonr(test1, test2)
print("対応なしt検定の効果量Cohen's d:", cohen_d)
print("対応なしt検定の効果量Pearson's r:", correlation_coefficient)

（3）韦尔奇t检验效果量计算

#ウェルチ検定の効果量
t_stat, p_value = stats.ttest_ind(test1, test2, equal_var=False)

# 効果量d (Cohen's d)の計算
mean_diff = np.mean(test1) - np.mean(test2)
pooled_sd = np.sqrt(((len(test1) - 1) * np.var(test1) + (len(test2) - 1) * np.var(test2)) / (len(test1) + len(test2) - 2))
effect_size_d = mean_diff / pooled_sd

# 効果量rの計算
effect_size_r = abs(mean_diff) / np.sqrt((np.std(test1)**2 + np.std(test2)**2) / 2)

# 効果量dおよび効果量rの表示
print("ウェルチ検定効果量d (Cohen's d):", effect_size_d)
print("ウェルチ検定効果量r (effect size r):", effect_size_r)

*效果量大小的指标

水本篤，竹内理 (2008) 研究論文における効果量の報告のために. 基礎的概念と注意点. 英語教育研究, 31：57-66

关注

6
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

TUTO_TUTO CSDN认证博客专家 CSDN认证企业博客

码龄3年

16: 原创

110万+: 周排名

9万+: 总排名

3万+: 访问

: 等级

483: 积分

235: 粉丝

317: 获赞

11: 评论

479: 收藏

私信

关注

热门文章

分类专栏

终端快捷操作 1篇
python 10篇
统计学 11篇
Flask 1篇
前端 1篇
语言分析随笔 1篇

最新评论

【统计学】参数检验和非参数检验的区别和基本统计学
Jimpasses: 引用「参数」参数是指在统计分析中用来描述总体特征的量，它通常是一个数值，代表总体的某种特征。例如，总体的平均数、方差、标准差等都是参数。参数是总体的属性，因此在统计分析中通常是未知的，需要通过样本来进行估计。
【Mac/Linux终端快捷操作】Finder移动/复制/合并文件
CSDN-Ada助手: 恭喜您写了第16篇博客，内容涉及Mac/Linux终端快捷操作，对于喜欢使用终端的用户来说，这篇文章一定会很有帮助。希望您能继续坚持创作，分享更多有趣、实用的内容给大家。或许下一步可以考虑分享一些高级的终端操作技巧，让读者更深入地了解这个领域。期待您的下一篇作品！
【Python・统计学】Kruskal-Wallis检验/H检验（原理及代码）
普通网友: 这篇文章真是一篇佳作!作者运用了生动有趣的语言,将枯燥的理论知识娓娓道来,让人如沐春风。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【Python・统计学】Mann-Whitney U检验/Wilcoxon秩和检验（原理及代码）
普通网友: 支持一下！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
【统计学】参数检验和非参数检验的使用条件（图表说明）
CSDN-Ada助手: 恭喜您发布了第12篇博客！标题看起来很有深度，参数检验和非参数检验的使用条件一直是统计学中的重要议题。希望您能够继续分享更多关于统计学的知识，也可以考虑结合实例或案例进行讲解，让读者更好地理解和应用这些概念。期待您的下一篇作品！加油！🌟🌟🌟

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。