R语言中的抽样方法与描述统计函数

抽样方法

常见的抽样方法

  • 简单随机抽样
  • 分层抽样
  • 系统抽样
# 导入数据
# 1 金融  2 建筑   3 外语
data <- read.csv("E:\\Github\\code-learning\\R\\data\\第11期资料\\data.csv")
# 按照专业和ID排序
data <- data[order(data$专业,data$ID),]
head(data)
专业 ID 收入
375 1 A001 6811
360 1 A002 3976
505 1 A003 2692
470 1 A004 8156
214 1 A005 2169
450 1 A006 6142

简单随机抽样

简单随机抽样最基本的抽样方法。分为重复抽样和不重复抽样。社会调查采用不重复抽样。

sample(x,size,replace=FALSE,prob=NULL)

  • x :抽样总体
  • size: 样本容量
  • replace: 是否有放回
  • prob: 抽样概率,默认等概率

使用sample函数要将数据按照升序排序

# 对数据序号抽样
# 无放回的抽取10个样本
index_11 <- sample(1:nrow(data),10,replace = FALSE)
index_11
data[index_11,]
  1. 202
  2. 181
  3. 392
  4. 222
  5. 22
  6. 117
  7. 190
  8. 247
  9. 135
  10. 169
专业 ID 收入
65 2 B102 8522
369 2 B081 8386
309 3 C092 6151
169 2 B122 6439
392 1 A022 4371
41 2 B017 4203
428 2 B090 5392
44 2 B147 3291
402 2 B035 7097
523 2 B069 8141
# 又放回的抽取收入大于6000的5个样本
index_12 <- sample(data$ID,5,replace = TRUE)
index_12
  1. C118
  • 3
    点赞
  • 51
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值