R语言
R语言从入门到精通
【风的季节】
Good good study,day day up
展开
-
1. R语言运行效率分析_小结(6)
小结(6)本节把前面所有数据综合起来进行分析。1000<n<1000000。数据格式与前面的一样。以下是作图代码。在本图中,由于数据的数量级差有些大,所以用对数坐标画图。library(tidyverse)library(scales)ggplot(data[which(data$fun!="ddply_parallel"),],aes(n,mean,color=fun))+...原创 2020-02-24 00:40:17 · 299 阅读 · 0 评论 -
1. R语言运行效率分析_小结(5)
小结(5)上节讨论了数据量n<100000时名个函数用时规律,本节讨论100000<n<10000000的情形。画图方法如上节。从上图可以看出,for_ifelse和str_replace花费时间波动性较大。波动范转大约分别为(6,20)和(3,9)。其余6个函数相对校稳定。接下来分析0~5 微秒/1000中间的情况。如下图:从上图可以看出,花费的时间join<w...原创 2020-02-23 14:28:46 · 263 阅读 · 0 评论 -
1. R语言运行效率分析_小结(4)
小结(4)上节讨论了数据量n<1000时名个函数用时规律,本节讨论1000<n<100000的情形。画图方法如上节。与上一节的图相比,明显变换就是处理每个数据所需的时间减少很多。ddply已减少到5微秒以内。反而str_replace的速度在Month, season和all中差异比较大。接下来我们研究0~5微秒内的函数从上图可以看出,随着数据量的增大,只有 join函数...原创 2020-02-21 21:08:12 · 413 阅读 · 0 评论 -
1. R语言运行效率分析_小结(3)
小结(3)以上用到了9个方法实现一个问题,在实现的过程中试验数据量为n=10。得到不同方法所用的平均耗时间大小。每种方法在计算平均耗时的重复次数为N =100。当然上述的每个方法测试的数据量尽管相同,但由于(1)数据内容不尽相同,(2)由于测试耗时的时候后台打开的程序多少不同(CPU和内存任务量不同),(3)每种方法所处理的内容不尽相同。这些都对所测试的结果产生影响。为此,为了减小这些影响,本...原创 2020-02-19 00:15:43 · 341 阅读 · 0 评论 -
1. R语言运行效率分析_小结(2)
小结(2)以上用到了9个方法实现一个问题,在实现的过程中试验数据量为n=10。得到不同方法所用的平均耗时间大小。每种方法在计算平均耗时的重复次数为N =100。当然上述的每个方法测试的数据量尽管相同,但由于(1)数据内容不尽相同,(2)由于测试耗时的时候后台打开的程序多少不同(CPU和内存任务量不同),(3)每种方法所处理的内容不尽相同。这些都对所测试的结果产生影响。为此,为了减小这些影响,本...原创 2020-02-17 22:58:38 · 300 阅读 · 0 评论 -
1. R语言运行效率分析_小结(1)
小结(1)上述9种方法(10个月份)转换“月和季的英文名称”所花时间结果整理如下: type fun mean1 Month for_if 3.252180e-012 Month for_if_else 3.054237e-013 Month for_ifelse 5.160331e-014...原创 2020-02-16 21:23:16 · 299 阅读 · 0 评论 -
1. R语言运行效率分析(9)
方法9: 采用 ddply(.parallel=TURE) 语句并行原理参见:http://blog.sina.com.cn/s/blog_56a69a2f01016v0t.html或http://www.dataguru.cn/article-1320-1.html1: 自定义函数library(doSNOW)library(parallel)cl<-makeCluster(...原创 2020-02-14 23:54:02 · 210 阅读 · 0 评论 -
1. R语言运行效率分析(8)
方法8: 采用 ddply 语句1: 自定义函数Month_name_ddply<-function(month){ Month<-as.data.frame(month) Month$ID<-1:nrow(Month) df<-ddply(Month,.(month),function(x){mutate(x,month_name=month.abb[mo...原创 2020-02-08 18:52:00 · 239 阅读 · 0 评论 -
1. R语言运行效率分析(7)
方法7: 采用 join 语句1: 自定义函数Month_name_join<-function(month){ d_month<-1:12 d_month_name<-c("Jan","Feb","Mar","Apr","May","Jun","Jul","Aug","Sep","Oct","Nov","Dec") return(left_join(as.dat...原创 2020-02-06 20:52:50 · 218 阅读 · 0 评论 -
1. R语言运行效率分析(6)
方法6: 采用 str_replace_all 语句1: 自定义函数Month_name_str_replace_all<-function(month){ Month_name<-as.character(month) Month_name<-str_replace_all(Month_name,"1","Jan")%>%str_replace_all("2"...原创 2020-02-05 20:09:41 · 247 阅读 · 0 评论 -
1. R语言运行效率分析(5)
方法5: 采用 which 语句1: 自定义函数# digital was translated into englishnameMonth_name_which<-function(month){ Month_name<-month Month_name[(which(Month_name==1))]<-"Jan" Month_name[(which(Mont...原创 2020-02-04 21:24:57 · 409 阅读 · 0 评论 -
1. R语言运行效率分析 (4)
方法4: 采用 for + switch 语句1: 自定义函数# digital was translated into englishnameMonth_name_for_switch<-function(month){ Month_name<-c() for (i in 1:length(month)){ Month_name[i]<-switch(as...原创 2020-02-03 11:55:11 · 187 阅读 · 0 评论 -
1. R语言运行效率分析 (3)
方法3: 采用 for + ifelse 语句1: 自定义函数# digital was translated into englishnameMonth_name_for_ifelse<-function(month){ Month_name<-c() for (i in 1:length(month)){ ifelse (month[i]==1, Month_...原创 2020-02-02 16:48:24 · 236 阅读 · 0 评论 -
1. R语言运行效率分析 (2)
方法2: 采用 for + if + else 语句1: 自定义函数# digital was translated into englishnameMonth_name_for_if_else<-function(month){ Month_name<-c() for (i in 1:length(month)){ if (month[i]==1) Month_...原创 2020-02-01 19:34:54 · 237 阅读 · 0 评论 -
1. R语言运行效率分析(1)
测试程序运行所需时间的函数的选择在R语言中,统计一个程序体运行时间一般采用的函数为Sys.time()或者为proc.time()。不过,这两个函数只能根据时间差判断程序执行一次所用的时间,若要重复多次进行平均时间的统计,则显得无能为力。在此,我们采用microbenchmark函数包来进行统计程序运行时间。该函数使用很简单,只需要输入待测试代码,并且指定“times=N”,程序就会重复运行代...原创 2020-01-31 22:00:01 · 1558 阅读 · 0 评论