分析的精髓之二:抽样实现“随机”的两个便捷方法

我们如果要进行市场调研,往往要在母体中随机抽样,抽样的要求通常是要做到“随机”。为避免人为地随机抽取(有时个人采取的随机方法,往往因为有主观性,可能已经暗藏某种规律),而产生系统错误,我们经常利用机器来随机抽取。其中我个人知道比较快捷的方法有两种:

 

一、用EXCEL的随机公式。以前用EXCEL随机抽样的局限性是来自表只有65000多行,如果要在100万的数据中进行随机抽取,挺麻烦的。自从有了2007后,这个弊端缓解不少。如何用EXCEL随机抽样?

1)首先在母体数据的旁边一列输入”=rand()”,使每个数据(即每个个体)对应生成一个随机码。

2)然后把随机码复制后,用数据格式黏贴保存。

3)把数据按照随机码进行排序(按照降序或者升序),这样随机码就打乱整个数据的顺序,形成了随机的数据。

4)如果你需要从总体中抽取400个样本,那你就可以取排列靠前的400个数据就OK了。

 

二、使用SQL语句来随机抽样。假如你是需要从1千万的母体中随机抽取几百的样本,那用EXCLE2007也感觉很麻烦,可以使用SQL代码随机抽样。假如【表一】有1千万数据,我需要从中抽取7万,可以写以下代码实现。提醒一下,如果你是在ACCESS中的使用以下SQL代码进行随机抽样,是暂时实现不到,因为ACCESS里没有定义newid()函数。

 

select top 70000 *  ----按照随机码排序并抽取前面70000个数据

into 新表        ----把随机数据生成一个新表

from 表一       ----在表一中随机抽取,表一是母体

order by newid()  ----生成随机码

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值