分层抽样法

最新推荐文章于 2025-02-22 11:43:19 发布

newbei5862

最新推荐文章于 2025-02-22 11:43:19 发布

阅读量7.3k

点赞数

分类专栏：机器学习文章标签：机器学习

机器学习专栏收录该内容

24 篇文章

订阅专栏

分层抽样的具体程序是：把总体各单位分成两个或两个以上的相互独立的完全的组（如男性和女性），从两个或两个以上的组中进行简单随机抽样，样本相互独立。总体各单位按主要标志加以分组，分组的标志与关心的总体特征相关。例如，正在进行有关啤酒品牌知名度方面的调查，初步判别，在啤酒方面男性的知识与和女性的不同，那么性别应是划分层次的适当标准。如果不以这种方式进行分层抽样，分层抽样就得不到什么效果，花再多时间、精力和物资也是白费。

分层抽样与简单随机抽样相比，往往选择分层抽样，因为它有显著的潜在统计效果。也就是说，如果从相同的总体中抽取两个样本，一个是分层样本，另一个是简单随机抽样样本，那么相对来说，分层样本的误差更小些。另一方面，如果目标是获得一个确定的抽样误差水平，那么更小的分层样本将达到这一目标。

各层样本数的确定方法有3种：

①分层定比。即各层样本数与该层总体数的比值相等。例如，样本大小n=50，总体N=500，则n/N=0.1 即为样本比例，每层均按这个比例确定该层样本数。

②奈曼法。即各层应抽样本数与该层总体数及其标准差的积成正比。

③非比例分配法。当某个层次包含的个案数在总体中所占比例太小时，为使该层的特征在样本中得到足够的反映，可人为地适当增加该层样本数在总体样本中的比例。但这样做会增加推论的复杂性。

在调查实践中，为提高分层样本的精确度实际上要付出一些代价。通常，现实正确的分层抽样一般有三个步骤：

首先，辩明突出的（重要的）人口统计特征和分类特征，这些特征与所研究的行为相关。例如，研究某种产品的消费率时，按常理认为男性和女性有不同的平均消费比率。为了把性别作为有意义的分层标志，调查者肯定能够拿出资料证明男性与女性的消费水平明显不同。用这种方式可识别出各种不同的显著特征。调查表明，一般来说，识别出 6 个重要的显著特征后，再增加显著特征的辨别对于提高样本代表性就没有多大帮助了。

第二，确定在每个层次上总体的比例（如性别已被确定为一个显著的特征，那么总体中男性占多少比例，女性占多少比例呢？）。利用这个比例，可计算出样本中每组（层）应调查的人数。

最后，调查者必须从每层中抽取独立简单随机样本。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。