随机抽样的三种模型(简单随机抽样、分层抽样、系统抽样),自定义封装函数直接调用
手动反爬虫,禁止转载: 原博地址 https://blog.csdn.net/lys_828/article/details/116329147
知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息
1 抽样方法
具体的抽样方法有三种。即简单随机抽样、分层抽样和系统抽样。有些时候抽样不是一次性就可以完成的,就需要我们安排多次数据的抽取,比如在全国范围内选择一定数量的用户作为试点调查,无法直接一次性就完成了,故需要分阶段进行。那么关于抽样的选择可以按照下图进行
- 简单随机抽样:顾名思义就是简单随机抽,给定个数值或者比例,就按照这个规定抽取数据进行
- 分层抽样:就是给定一个参照的字段,然后再给定个数值或者比例,接着就是对这个字段中的分类数据进行抽取
- 系统抽样:按照一定的数值或者比例进行,比如每两个数据取一个,或者1%的数据取一个