R函数在数据预处理、数据准备过程中的使用

数据准备是数据分析工作的绝大部分,所消耗的时间约占80%以上,

因此如何有效的提高处理的速度是很有必要的。


R不但是用于分析建模的好工具,在数据预处理方面也有很多便捷的函数使用:

1- apply类函数的使用(R中最好减少loops)

apply类函数使用:

matriz <- matrix(round(runif(9,1,10),0),nrow=3)
apply(matriz, 1, sum) ## sum by row
apply(matriz, 2, sum) ## sum by column
tapply(mtcars$hp, mtcars$cyl, mean)
lista <- list(a=c('one', 'tow', 'three'), b=c(1,2,3), c=c(12, 'a')) 
lapply(lista, length) ## return a list
sapply(lista, length) ## coerce to a vector

do.call总会有意想不到的收获--black magic
data <- split(mtcars, mtcars$gear) ## split 
fits <- lapply(data, function(x) return(lm(x$mpg~x$disp)$coef)) ## apply
do.call(rbind, fits) ## recombine




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值