python 假设检验p值_python scipy.stats计算双独立样本假设检验(2 sample independent test)...

完全独立随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。例如两个不同版本的测试程序对产品温度控制是否一样;两种不同的加工方法加工出的工件长度是否一样等。#_*_coding:utf-8_*_

#本节内容学习用python统计包scipy自动计算双独立假设检验:

'''

双独立(independent)样本检验(ttest_ind)'''

import numpy as np

import pandas as pd

from scipy import stats

import matplotlib.pyplot as plt

import seaborn as sns

from pylab import mpl

mpl.rcParams['font.sans-serif'] = ['SimHei'] # 雅黑字体

plt.rcParams['axes.unicode_minus']=False

#T检验是假设检验的一种,又叫student t检验(Student’s t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。A=[1.629,1.628,1.63,1.632,1.633,1.634,1.635,1.635,1.6335,1.6351,1.636,1.6362,1.637,1.638,1.639,1.72,1.721,1.731]

B=[1.628,1.6289,1.631,1.63,1.634,1.634,1.635,1.635,1.6335,1.6351,1.636,1.6362,1.637,1.637,1.636,1.73]

dataA=np.array(A)

dataB=np.array(B)

A_mean=dataA.mean()B_mean=dataB.mean()

print('A版本的平均值=',A_mean)

print('B版本的平均值=',B_mean)'''

这里要区别:数据集的标准差,和样本标准差

数据集的标准差公式除以的是n,样本标准差公式除以的是n-1。

样本标准差,用途是用样本标准差估计出总体标准差pandas计算的标准差,默认除以的是n-1,也就是计算出的是样本标准差''''''#样本标准差a_std=dataA.std()

b_std=dataB.std()print('A版本样本标准差=',a_std)

print('B版本样本标准差=',b_std)

#零假设:A版本和B版本没有差别,也就是A版平均值=B版本平均值

#备选假设:A版本和B版本有差别,也就是A版本平均值不等于B版本平均值

#因为有2组样本,是不同的人,选择双独立样本检验.两样本均值比较,双尾检验.sns.distplot(dataA)

plt.title('A版本数据集分布')

plt.show()

sns.distplot(dataB)

plt.title('B版本数据集分布')

plt.show()

'''

Scipy的双独立样本t检验不能返回自由度,对于后面计算置信区间不方便。所以我们使用另一个统计包(statsmodels)

'''

'''

ttest_ind:独立检验双样本t检验,usevar='unequal'两个总体方差不一样

返回的第1个值t是假设检验计算出的t值,

第2个p_two是双尾检验的p值

第3个DF是独立双样本的自由度'''import statsmodels.stats.weightstats as stt,p_two,df=st.ttest_ind(dataA,dataB, usevar='unequal')print('t=',t,'p_twotail=',p_two,'df=',df)

#判断标准(显著水平)使用alpha=0.05

alpha=0.05

#做出结论

if (p_two

print('拒绝零假设,A和B版本有差异')

else:

print('接受零假设,A和B没有差别')

程序运行结果为:A版本的平均值= 1.6490444444444445

B版本的平均值= 1.63979375

A版本样本标准差= 0.03370152027929608

B版本样本标准差= 0.023452384440339966

t= 0.9093861632613868 p_twotail= 0.37029967620807425 df= 30.402183227443754

接受零假设,A和B没有差别

由于P>0.05; A版本和B版本没有区别。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 我了解Scipy.stats,它是一个用于统计计算Python模块。 你好!Scipy.stats 是一个 Python 库,提供了大量用于数据分析、概率计算和统计分布的函数和类。Python Scipy.stats 是一个用于科学计算和统计分析的 Python 库。它提供了大量用于数据探索、描述性统计、概率分布和假设检验等的函数。 Scipy.stats 中包含了多种概率分布函数,包括连续型分布(如正态分布、指数分布和威布尔分布等)和离散型分布(如泊松分布和二项分布等)。此外,它还提供了许多统计函数,如假设检验、相关分析、方差分析等。 下面是一些 Scipy.stats 常用函数的示例: 1. 正态分布 ```python from scipy.stats import norm # 计算正态分布概率密度函数在 x=1 处的取 norm.pdf(1) # 计算正态分布累积分布函数在 x=1 处的取 norm.cdf(1) # 计算给定正态分布的均和标准差时,从 -1 到 1 区间的概率密度函数 norm.interval(0.68, loc=0, scale=1) ``` 2. t 分布 ```python from scipy.stats import t # 计算给定 t 分布的自由度,从 -1 到 1 区间的概率密度函数 t.interval(0.68, df=10, loc=0, scale=1) # 计算两个样本的 t 统计和 p ,用于假设检验 ttest_ind(sample1, sample2) ``` 3. 卡方分布 ```python from scipy.stats import chi2 # 计算给定卡方分布的自由度,从 0 到 2 区间的概率密度函数 chi2.interval(0.68, df=5, loc=0, scale=1) # 计算卡方分布的 p ,用于假设检验 chisquare(observed, expected) ``` 以上是 Scipy.stats 库的一些常用函数。你可以通过调用这些函数和查看其文档来进一步了解该库的使用。 ### 回答2: Python是一种广泛使用的编程语言,而Python scipy.stats是Python中的一个统计学模块。它是一个极其强大的模块,用于执行各种统计和概率分布操作。这个模块是SciPy库的一部分,SciPy是一个Python库,专门用于数学、科学和工程计算Python scipy.stats可以用于在Python中生成各种概率分布,如正态分布、泊松分布、二项分布、t分布等等。使用它可以计算每个概率分布的概率密度、累积分布函数和逆累积分布函数。 除了概率分布之外,Python scipy.stats还提供了各种统计测量功能,例如Kendall的Tau系数、Spearman的等级相关系数、Pearson的相关系数、均、中位数、标准差等。还可以使用Python scipy.stats来进行假设检验,例如单样本样本t检验、卡方检验等等。 Python scipy.stats还提供了一些有用的函数,如峰度(kurtosis)、偏态(skewness)、最大、最小和极差。将这些函数与概率分布和统计测量相关函数相结合,可以在Python中快速完成高级统计分析操作。 总的来说,Python scipy.stats对于希望利用Python进行统计分析的科学家和工程师来说是非常有用的。它提供了方便、快速和高效的数据分析工具,使得研究人员可以更简单、更迅速地实现各种复杂的统计分析操作。 ### 回答3: PythonScipy库提供了许多统计函数,其中最重要的是scipy.stats模块。在统计学和数据科学中,scipy.stats被广泛用于概率分布的计算、分位数的计算假设检验、线性回归、方差分析等。 该模块提供了多种分布概率密度函数的计算。例如,正态分布(norm)、t分布(t)、卡方分布(chi2)、F分布(f)、伽马分布(gamma)等。对于每种分布,该模块提供了一个或多个方法计算概率密度函数、累积分布函数、分位数等。除此之外,还有如半正态分布、冈分布、三角分布等其它分布概率密度函数的计算。 与此同时,该模块还可用于执行假设检验。例如,在从正态分布中取样时,可以使用t检验测试样本和总体的均是否不同。还可以使用方差分析(ANOVA)来比较不同组的平均是否有差异。 scipy.stats模块还提供了一些关于线性回归的函数,例如pearsonr和spearmanr方法可以计算线性相关系数和斯皮尔曼等级相关系数。还可以使用linregress方法进行回归分析,包括计算斜率、截距、标准错误、t和p。 总的来说,scipy.stats是Python科学计算的重要组成部分,对于数据科学家、研究人员等人员来说非常有用,可以方便地计算和分析各种数据分布和假设检验,并且提供了一些常见的统计函数来解决数据问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值