一、从数据集中取子集
这里以数据框x做演示
x <= read_excel('车险数据.xlsx')
(一)索引的方法
1、常规方法索引取子集
x1 <- x[c(1:30),c(1:3)] #连续筛选索引1~30行;1,2,3的数据为x1
x2 <- x[c(1,3,6),c(2,4,1)] #不连续筛选索引1,3,6行;1,2,4列的数据为x2
2、subset函数取子集
书写格式:subset(数据对象名,条件)
y1 <- subset(x,x$nclaims<=10 & x$claimamt>=1000)
(二)sample( )函数的使用
sample( )函数用于从大数据集中随机抽样,基本书写格式如下:
sample(数据对象名,抽取元素个数,replace=T/F)
其中replace为真时,允许重复抽取
sample(x,30,replace=F)