接着上文说,简单随机抽样法和分层抽样法的对比有过一个经典的例子。1936年美国总统大选,《文学文摘》杂志对结果进行了调查预测。他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,邮寄一千万份问卷调查表,回收约240万份,结论是兰登取胜,而盖洛普也组织了抽样调查,进行民意测试。他的预测与《文学文摘》截然相反,认为罗斯福必胜无疑。结果,罗斯福赢得了2770万张民众选票,从此盖洛普名声大噪,而盖洛普采用的就是分层抽样法。
乔治·盖洛普
分层抽样法是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样本的方法,可以避免对样本来源集中于某一群体,能够更客观地反映全体投票者的倾向。盖洛普根据白人和黑人的比例,穷人和富人的人口比例,调整调查样本的比例,将人口分为不同层次,按照层次比例分配样本数,而后在每个层次内使用随机抽样的方式进行调查。
具体来说,确定各层样本数的方法有三种:
第一是分层定比。即各层样本数与该层总体数的比值相等。例如,样本大小n=50,总体N=500,则n/N=0.1 即为样本比例,每层均按这个比例确定该层样本数。这种方法存在的问题在于,某些事情所占比例虽低但影响巨大,例如信用卡信用评级,逾期用户是少数,但确实研究重点,要是按照比例抽样会造成样本不足。