Python统计检验(一)

一、简介

介绍了8种常见的统计检验方法,包括方差分析、卡方检验、t检验等。首先简单回顾统计检验方法的作用、原假设、应用场景等,然后用Python实现并解读结果。同时,为获取直观理解,穿插展示了热力图、Q-Q图、小提琴图、散点矩阵图、交互效果图等可视化图表。内容重在实战,不涉及高深理论知识及推导。

重要事情说三遍~
想听我讲案例,请点这里,进入B站
想听我讲案例,请点这里,进入B站
想听我讲案例,请点这里,进入B站

二、框架

在这里插入图片描述

三、附部分代码及输出

#相关系数
plt.figure(figsize=(15,12))
sns.heatmap( data_a.corr(method='pearson'), annot=True )
plt.show()
#散点矩阵图
cates=['v_0', 'v_1', 'v_2']
sns.pairplot(data[cates])

from scipy import stats
#方差齐性检验
w, p = stats.levene(*test_data)
#单因素方差分析
f, p = stats.f_oneway(*test_data)

from statsmodels.stats.multicomp import pairwise_tukeyhsd
print(pairwise_tukeyhsd(data['price_log'], data['bodyType']))

#多方差分析
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
anova_res = anova_lm(ols('price_log~C(bodyType)+C(brand)+C(bodyType):C(brand)', data).fit())

# 这三个交互效果的可视化画图
from statsmodels.graphics.api import interaction_plot
from pylab import mpl      # 显示中文

#t-检验
from scipy.stats import ttest_ind
stat, p = ttest_ind(data1, data2)

#卡方检验
from scipy.stats import chi2_contingency
#列联表
obs=pd.crosstab(data['amend_a_regionCode'],data['brand'], rownames=['amend_a_regionCode'], colnames=['brand'])
stat, p, dof, expected = chi2_contingency(obs)

#Q-Q图
from statsmodels.graphics.api import qqplot
qqplot(data['price_log'],fit=True, line='45').show()

#正态检验
from scipy.stats import shapiro
stat, p = shapiro(data)

#Mann-Whitney U Test
from scipy.stats import mannwhitneyu
stat, p = mannwhitneyu(data1, data2)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

四、参考材料

微信公众号"Datawhale"及CSDN博客

文章1:<常用数据分析方法:方差分析及实现!>
文章2:<机器学习数学基础:常见分布与假设检验>

可结合公众号文章与我的视频一起学习,加深理解!

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值