1. 性能测评
时间测定方法
R中提供的测量时间最简单的方法是system.time函数。
system.time(expr, gcFirst=TRUE)
这个函数会在不降低程序运行性能的情况下,执行表达式expr,gcFrist则是指定程序运行前是否先执行垃圾回收。
do.stuff <- function(){
a <- 1:100000
for(i in 1:100000){
a[i] <- a[i]^2
}
a
}
system.time(do.stuff())
监控内存方法
R中函数gc(),有两个功能,一是立即执行一次垃圾清理,二是显示剩余内存的统计信息。
gc()
used是当前使用情况,gc trigger是会触发垃圾回收的值,max used是上次gc()操作或者是此次启动R后使用最大值。(Mb)是Ncells和Vcells的大小转换为Mb单位时的值。
Ncells即cons cells,32位R中占28B,64位R中占56B,我是用的32位的R,所以2616689*28/(1024^2) = 69.9。
Vcells即vector cells,占8B,所以63817864*8/(1024^2) = 486.9。
不是很懂Ncells和Vcells分别指的是R中的什么对象,网上也没找到很确切的说法,所以不知道应该怎么去翻译它们,有知道的朋友希望能告知,谢谢!
R中object.size()函数可以查看每个对象占用内存数。
object.size(1)
object.size(train)