使用函数sample进行抽样

最新推荐文章于 2024-10-25 17:03:19 发布

lijinxiu123

最新推荐文章于 2024-10-25 17:03:19 发布

阅读量5.2k

点赞数 3

分类专栏： r语言入门文章标签：使用函数sample进行抽样 r语言

r语言入门专栏收录该内容

24 篇文章 3 订阅

订阅专栏

x=1:10

> sample(x=x)

[1] 3 5 9 6 10 7 2 1 8 4

第一行代码表示给x向量赋值1~10，第二行代码表示对x向量进行随机抽样。结果输出为每次抽样抽得的结果，可以看出该抽样为无放回抽样------最多抽n次，n为x向量中元素的个数。

如果想指定在该向量中抽取元素的个数，需要加一个参数size：

> x=1:1000

> sample(x=x,size=20)

[1] 66 891 606 924 871 374 879 573 284 305 914 792 398 497 721 897 324 437

[19] 901 33

这是在1~1000的正整数中抽样，其中size指定抽样的次数，抽了20次，结果如上所示。

这些都是无放回抽样。所谓无放回抽样，也就是说某个元素一旦被选择，该总体中就不会再有该元素。如果是有放回抽样，则需添加一个参数repalce=T：

> x=1:10

> sample(x=x,size=5,replace=T)

[1] 4 7 2 4 8

“replace”就是重复的意思。即可以重复对元素进行抽样，也就是所谓的有放回抽样。我们看上面的结果，元素4在5次随机抽样的过程中被抽取了两次。

有时候我们的抽取元素的概率未必相等（如常见的二项分布概率问题），此时我们需要添加一个参数prob，也就是“probability”（概率）的缩写。假设一名医生给患者做某手术成功的概率是80%，那么现在他给20例病人做手术，可能有哪几次是成功的呢？代码如下：

> x=c("S","F")

> sample(x,size=20,replace=T,prob=c(0.8,0.2))

[1] "F" "S" "S" "S" "S" "S" "S" "S" "S" "S" "S" "S" "F" "S" "S" "F" "S" "S"

[19] "F" "S"

其中“S”代表成功，“F”代表失败。

> x=c(1,3,5,7)

> sample(x,size=20,replace=T,prob=c(0.1,0.2,0.3,0.9))

[1] 3 5 7 3 7 3 7 5 3 7 7 7 1 5 7 5 7 7 3 7

这些代码告诉我们，对每一个元素都可以给定一个概率，且每个概率是独立的，即在参数prob中，不一定所有元素的概率加起来等于1，它只代表某元素被抽取的概率而已。

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。