假设检验
t检验
原假设是年龄等于38岁,备择假设为年龄不等于38岁
import statsmodels.api as sm
# t检验, 检验年龄是否为38岁
# 原假设是你年龄等于38岁,备择假设为年龄不等于38岁
d1 = sm.stats.DescrStatsW(insurance['age'])
#假设为0.1
print('t检验= %.4f,p-value=%.4f, df=%s' % d1.ttest_mean(38))
备择假设B的均值大于A
stats.ttest_ind(B,A,equal_var = False)
相关系数
皮尔逊相关系数
corr_pear = insurance[['age','charges']].corr(method='pearson')
print('年龄和保险费用的皮尔森相关系数为: %.3f' % corr_pear.loc['age','charges'])
斯皮尔曼相关系数
corr_spearman = insurance[['age','charges']].corr(method='spearman')
print('年龄和保险费用的斯皮尔曼相关系数为: %.3f' % corr_spearman.loc['age','charges'])
kendall相关系数
主要用于衡量两个变量间非线性关系比较好,更多的用于有序性分类变量
corr_kendall = insurance[['age','charges']].corr(method='kendall')
print('年龄和保险费用的kendall关系数为: %.3f' % corr_kendall.loc['age','charges'])