需要用到numpy库
import numpy as np
import scipy.stats as stats
import scipy.optimize as opt
首先我们来创造两个数组作为测试数据
n = 200
norm_dist = stats.norm(loc=0.5, scale=10) #构造一个正态分布,均值为0.5,标准差为10 “标准差”也称“均方差”,是“方差”开根号
dat = norm_dist.rvs(size=n) #随机取200个点
print ("mean of data is: " + str(np.mean(dat)))
print ("median of data is: " + str(np.median(dat)))
print ("standard deviation of data is: " + str(np.std(dat))) #因为这200个点是随机取得,所以跟原先的正态分布可能有一些不同
norm_dist2 = stats.norm(loc=0.2, scale=1)
dat2 = norm_dist2.rvs(size=n/2)#随机取100个点
print ("mean of data is: " + str(np.mean(dat2)))
print ("median of data is: " + str(np.median(dat2)))
print ("standard deviation of data is: " + str(np.std(dat2)))
对这两个数组分析差异---双样本的t检验
stat_val, p_val