在SAS中进行随机抽样

1、在实际数据处理中常常需要进行样本抽样,在实践中主要有两种情况:

(1)简单无重复抽样

(2)分层抽样   a.等比例分层抽样  b. 不等比例分层抽样

2、SAS 中可以利用PROC suveryselect 过程实现各种抽样

         其一般形式是:

PROC SURVEYSELECT  data=<源数据集名> method = <srslursl sys >  out=<抽取样本存放的数据集> n=<抽取数量>(or samprate=抽样比例) seed =n;
           strata <指定分层变量>;
           id <指定抽取的样本所保留的源数据集变量>;
run;
 
说明:method用来指定随机抽样方法的,其中SRS是指不放回简单随机抽样(Simple Random Samping);urs是指放回简单随机抽样(Unrestricted Random Sampling);sys是指系统抽样(Systematic Sampling)。seed用来指定随机种子数,为非负整数,取0则每次抽取的样本不同,若取大于0的整数,则下次抽样时若输入相同值即可得到相同的样本;id是指定从源数据集复制到样本数据集的变量,若缺省,则复制所有变量。
 

3、简单无重复随机抽样举例:

      /*按30%的比例从test数据集中抽取样本,并把样本输出到results数据集中*/

    proc surveyselect  data=test1 out=results1  method=srs samprate=0.3;

    run;

 

4、分层等比例随机抽样举例;

proc sort data=test2;

by 分层变量;

run; /**先用分层变量对总体样本进行排序/

proc surveyselect  data=test2 out=results2 method=srs samprate=0.1;

strata 分层变量;

run;  /*根据分层变量等比例从总体中抽取样本*/

 

5、分层不等比例抽样举例;

(1)手工设置抽样比例或者抽样数

proc sort data=test3;

by 分层变量;

run;                                                                   /**先用分层变量对总体样本进行排序/

proc surveyselect  data=test3 out=results3 method=srs

 samprate=(0.1,0.3,0.5,0.2);                           /*根据分层情况设置每一层要抽取的比例*/

strata 分层变量;

run;                                                                /*根据分层变量不等比例从总体中抽取样本*/

    

proc surveyselect  data=test3 out=results3 method=srs

n=(30,20,50,40);                           /*根据分层情况设置每一层要抽取的样本数*/

strata 分层变量;

run;             

(2)根据抽样表进行不等比例抽样

proc sort data=test3;

by 分层变量;

run;                                                                   /**先用分层变量对总体样本进行排序/

proc surveyselect  data=test3 out=results3 method=SRS

samprate=samp_table;                           /*通过抽样比例数据集进行抽样,samp_table数据集中要包括分层变量 以及每一分层对应的抽样比例或者数量,如果按比例抽样变量必须用_rate_来命名抽样比例,如果是按数量抽样必须用_nsize_来命名抽样数量*/

strata 分层变量;

run;             

6、关于surveyselect过程的更多内容详见SAS帮助

      在命令栏输入 help surveyselect  然后按enter键即可。

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值