数据生成
- 通过已有变量运算得到新的变量:+ - * / ^or**(求幂)x%%y (求余) x%/%y(整数除法)
e.gmydata$mean =( mydata$x1+mydata$x2)/2
ormydata <- transform(mydata, sumx = x1+x2, meanx = (x1+x2)/2)
数据清洗
变量的重编码
- 数值划分为类别
ageCat[age > 75] <- "Elder"
ageCat[age >=55 & age <= 75] <- "Middle age"
ageCat[age < 55] <- "Young"
也可以用within()函数改写,与with()不同的是,它允许更改数据框中的数据。
- 数值替换