Python|定性验证四种抽样方法下样本均值的一致性(相合性)

本文通过5至30次抽样分析,对比了简单随机不放回、分层抽样(放回与不放回)、整群抽样和等距抽样的样本均值一致性。使用概率拟合验证了各种抽样方法的相合性。
摘要由CSDN通过智能技术生成

本文通过对同一个样本分别抽样5、10、15、20、25、30次,并进行概率拟合画图,验证了四种抽样方法下样本均值的一致性(相合性)。

里面只有简单随机抽样(放回和不放回)、分层抽样写了是怎么抽出来的,整群抽样部分因为水平不够,是另外写了一段手动抽出来的。(此处应有link)

等距是同学抽的,不清楚具体。

import xlrd
import random
import numpy as np
import matplotlib.pyplot as plt
import seaborn
import math
import xlwt
#读取数据
workbook = xlwt.Workbook(encoding='utf-8',style_compression=0)
worksheet1 = workbook.add_sheet('test_sheet',cell_overwrite_ok=True)
data = xlrd.open_workbook("问卷数据1.xlsx")
table = data.sheets()[0]
sex = table.col_values(0)
height = table.col_values(1)
scores = table.col_values(5)
del sex[0]
del height[0]
del scores[0]
heightsp = []
#初始设置
colors = {
   0:'#D3EEF5',1:'#A6DDEA',2:'#7ACBE0',3:'#227A8F',4:'#165160',5:'#062329'}
means = []
for i in range(6):
	means.append([])
stds = []
for i in range(6):
	stds.append([])
#总体身高均值
height_array = np.array(height)
height_mean=height_array.mean()

1 简单随机不放回抽样

1.1 不放回

def sampling_1m(n,t,times =30):
    for i in range(times):
        height_sample = []
        height_sample += random.sample(height,n)
        height_sample_array = np.array(height_sample)
        means[t].append(height_sample_array.mean())
    seaborn.kdeplot(means[t],label = 'n = %s'%(n),color = colors[t])
means = []
for i in range(6):
    means.append([])
sampling_1m(5,0)
sampling_1m(10,1)
sampling_1m(15,2)
sampling_1m(
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值