在模拟实际数据情况时,常常会使用随机抽样函数来从整体中挑出部分样本数据。随机抽样又分为重复随机抽样和不重复随机抽样两种。重复抽样是指:本次从整体中抽取出的数据样本,在下一次抽取时同样有机会被抽取。不重复抽样就是:一旦被抽取为样本,下次就不能再被抽取了。
sample函数可以完成随机抽样处理,其基本形式为:
sample(x, size, replace = FALSE)
具体参数的含义如表2-21所示。
表2-21 sample函数参数说明
参数 说明
x 整体数据,以向量形式给出
size 抽取样本的数目
replace 如果为F(默认),则是不重复抽样,此时size不能大于x的长度;
如果为T,则是重复抽样,此时size允许大于x的长度
相应的示例代码如下:
3 sample(c(1:20),size=10) #在1~20数据中不重复地随机抽取10个元素作为样本
4 [1] 8 2 20 11 14 6 19 1 12 9
5 sample(c(1:20),size=30,replace=T) #重复地随机抽取30个元素作为样本
6 [1] 8 20 12 15 8 6 13 9 2 10 7 2 11 8 17 3 16 7 11 9 15 18 9 5
7 [25] 16 1 18 1 11 2