我们要分析数据,当面对大量数据的时候,不可能每个数据都看一遍,就需要用到一些采样方法。通过采样得到的数据了解数据的规律和特征。
1、平均随机抽样
有10000个数据,任意随机抽取100条。
2、分类抽样
有10000个数据,有10个类目,每类1000条,可以考虑每个种类抽取50条。
3、分类、按照百分比抽样
如果有10000个数据。假如是身高数据,按照正态分布。那么根据正态分布,对每个高度取一定的样本,做分析。
我们要分析数据,当面对大量数据的时候,不可能每个数据都看一遍,就需要用到一些采样方法。通过采样得到的数据了解数据的规律和特征。
1、平均随机抽样
有10000个数据,任意随机抽取100条。
2、分类抽样
有10000个数据,有10个类目,每类1000条,可以考虑每个种类抽取50条。
3、分类、按照百分比抽样
如果有10000个数据。假如是身高数据,按照正态分布。那么根据正态分布,对每个高度取一定的样本,做分析。