R
chenlongzhen_tech
[声明] 此账号不在更新,请关注 http://blog.csdn.net/tech_chenlongzhen
展开
-
week1note
1.拉直a <- matrix(1:10, ncol = 2, byrow = T)amatrix(a, ncol = 1)2.applyapply(X, MARGIN, FUN, ...)其中X为一个数组,MARGIN是固定哪些维不变,FUN是用来计算的函数。例如,设a是n*m 矩阵,则apply(a, 1, sum)的意义是对a的各行求和(保留第一维即第一个下标不变),结果是一个长度为n的向原创 2015-03-15 14:44:34 · 568 阅读 · 0 评论 -
用xlsx包读取Excel文件
http://blog.csdn.net/liu7788414/article/details/44587213#t4xlsx包可以读取、写入Excel2007/2003文件并支持格式的设置。简单地来说,将Excel读取为数据框,以及将数据框写入为Excel文件都不是问题,而更加强大的是它能处理 Excel中的格式,比如合并单元格,设置列的宽度,设置字体和颜色等等。 如果只需要基本的读取/写入操作转载 2015-04-27 20:24:05 · 2342 阅读 · 0 评论 -
transwarpR研究笔记(持续中)
正在学习transwarpR, 一开始尝试使用开源的sparkr函数发现不能直接用,困惑多多。一下是学习的记录。kmeans运行成功!Step 1 创建 hdfs 路径与上传文件$ hdfs dfs -mkdir /user/Rest/kmeans 创建hdfs文件夹$ hdfs dfs -put data/kmeans.txt /user/Rest/kmeans/ 上传本地文件到hdfsSte原创 2015-04-13 14:07:00 · 1390 阅读 · 0 评论 -
R中高效读取文件readxl, read.fwf
read.fwfff <- tempfile()cat(file = ff, "123456", "987654", sep = "\n")read.fwf(ff, widths = c(1,2,3)) #> 1 23 456 \ 9 87 654 V1 V2 V31 1 23 4562 9 87 654read.fwf(ff, widths = c(1,-2,3)) #>原创 2015-05-10 15:56:40 · 7829 阅读 · 0 评论 -
【转载】R语言扩展包dplyr笔记
http://blog.163.com/zzz216@yeah/blog/static/16255468420147179438149/转载 2015-05-01 13:00:16 · 1250 阅读 · 0 评论 -
白噪声检验记录
数据进行中心化acf自相关图(ACF除了lag=0外,是否都很小就是白噪声,平均而言,仅能有5%的相关系数线超过虚线,如果有更多,那么我们的分析或者说结果是有疑问的)。参考网址:acf(dataVec, main = "acf") 从图中,有很多大于了0.05,说明序列见存在相关性,不是白噪声。Ljung-Box q 统计量纯随机性检验,p值小于5%,序列为非白噪声用于检验某个时间段内的一系列原创 2015-05-06 17:24:52 · 27196 阅读 · 1 评论 -
dplyr 文档翻译
http://ijiaer.com/r-learn-dplyr/转载 2015-05-29 13:19:33 · 995 阅读 · 0 评论 -
R语言13行代码实现神经网络
参考自11行python x <- data.frame(c(0,0,1),c(0,1,1),c(1,0,1),c(1,1,1)) y <- c(0,1,1,0) x <- as.matrix(t(x)) col <- ncol(x) syn0 <- matrix(rnorm(numberofUnits * col ),ncol=col,nrow=numberofUnits)原创 2015-08-22 16:44:05 · 5328 阅读 · 0 评论 -
centOS安装Rstudioserver
Rstudio官网网址先决条件 RStudio Server v0.98 需要entOS 5.4以上版本,并且需要一些前置包(包括R语言)这些包可以在 Extra Packages for Enterprise Linux (EPEL)找到,所以需要使用EPEL Fedora EPEL website.EPEL安装方法配置好EPEL后安装Rsudo yum install R下载和安装RSTUIO原创 2015-03-08 10:37:41 · 2601 阅读 · 0 评论 -
r语言 利用log4r和trycatch收集异常日志例子
#创建日志# Import the log4r package.library('log4r')# Create a new logger object with create.logger().logger <- create.logger()# Set the logger's file output.logfile(logger) <- 'peaktrainDebugging.log'#原创 2015-08-07 12:08:39 · 4128 阅读 · 0 评论 -
在CentOS 安装R语言
http://blog.sina.com.cn/s/blog_62b37bfe0102uy9i.html转载 2015-08-04 15:33:30 · 1315 阅读 · 0 评论 -
RMYSQL
devtools::install_github(“rstats-db/RMySQL”)转载 2015-08-21 10:52:28 · 403 阅读 · 0 评论 -
使用list.files函数遍历文件夹中的文件
http://blog.csdn.net/liu7788414/article/details/44461595#t1比如列出当前工作目录下的所有文件 list.files(getwd()) [1] “1.pdf” “10plots.pdf” [3] “140408696.txt”转载 2015-04-27 15:16:03 · 15828 阅读 · 1 评论 -
r语言kmeans聚类博客转载
http://www.cnblogs.com/bourneli/p/3645049.html转载 2015-04-16 21:24:38 · 1264 阅读 · 0 评论 -
reshape2包
http://www.loyhome.com/%E6%8E%A2%E7%B4%A2r%E5%8C%85reshape2%EF%BC%9A%E6%8F%89%E6%95%B0%E6%8D%AE%E7%9A%84%E6%9C%80%E4%BD%B3%E4%BC%B4%E4%BE%A3/转载 2015-04-09 21:58:45 · 973 阅读 · 0 评论 -
R语言week2note
因子函数factor()用来把一个向量编码成为一个因子.一般形式为:factor(x, levels = sort(unique(x), na.last = TRUE), labels, exclude = NA, ordered = FALSE)可以自行指定各离散取值水平(levels),不指定时由x的不同值来求得。labels可以用来指定各水平的标签,不指定时用各离散取值的对应字符串。ex原创 2015-03-15 15:58:23 · 721 阅读 · 0 评论 -
R语言 RmySQL使用记录
library(RMySQL)library(DBI)con<-dbConnect(MySQL(),user="",password="",dbname="powerloaddata",host="192.168.1.11")#显示表dbListTables(con)dbListFields(con,"raw_p_bus_zx")dbListFields(con,"DataZX")#调原创 2015-03-25 23:14:13 · 852 阅读 · 0 评论 -
第二周作业
查询tapply的函数帮助信息,并用帮助文件中的案例进一步学习(自己给一个新的例子).require(stats)groups <- as.factor(rbinom(32, n = 5, prob = 0.4))tapply(groups, groups, length) #- is almost the same astable(groups)把user.txt数据中的性别、年龄、身高原创 2015-03-16 18:09:36 · 1842 阅读 · 0 评论 -
SVM&nnet使用代码笔记
results<-data.frame(matrix(0,ncol=96*2,nrow=length(testseq))) for(col in 1:96) { train<-data_reshape[[col]][trainseq,] test<-data_reshape[[col]][testseq,] model<-svm(X7~.,train) pre<转载 2015-03-26 13:40:57 · 674 阅读 · 0 评论 -
week3note控制语句
1. switch语句switch是多分支语句,其用法为:switch (statement, list);statement是一个表达式,list是列表,也可以用有名定义。根据表达式与list的关系返回一个值。如果表达式返回值属于1:length(list)中的一个,则返回list中相应位置的值,否则返回NULL。example:a <- switch (2, 2+2, mean(1:10),原创 2015-03-17 15:22:24 · 585 阅读 · 0 评论 -
week3note函数
1. 基本函数用ls()函数可以查看当前工作空间保存的变量和函数,用rm()函数可以剔除不想要的对象.ls()可以指定一个pattern参数,此参数定义一个匹配模式,只返回符合模式的对象名.模式格式是UNIX中grep的格式.比如,ls(pattern="tmp[.]")可以返回所有以“tmp.”开头的对象名.rm()可以指定一个名为list的参数给出要删除的对象名,所以rm(list=ls(pat原创 2015-03-17 16:50:53 · 978 阅读 · 1 评论 -
week4reshape包
reshape包(转载自r实战)reshape包是一套重构和整合数据集的绝妙的万能工具。由于它的这种万能特性,可能学 起来会有一点难度。我们将慢慢地梳理整个过程,并使用一个小型数据集作为示例,这样每一步 发生了什么就很清晰了。由于reshape包并未包含在R的标准安装中,在第一次使用它之前需要 使用install.packages(“reshape”)进行安装。 大致说来,你需要首先将数据“转载 2015-03-24 15:49:37 · 622 阅读 · 0 评论 -
去除重复行duplicated
df2<-df1[!duplicated(df1[,1], fromLast=TRUE), ] fromLast就是保留重复行中最后一行原创 2015-04-11 14:18:13 · 3340 阅读 · 0 评论 -
第7周作业 相关性借补,knn插补
#install.packages('DMwR')library(DMwR)algae <- read.table('Analysis.txt',header=F, dec='.', col.names=c('season','size','speed','mxPH','mnO2','Cl','NO3','NH4','oPO4','PO4','Chla',原创 2015-04-19 21:16:23 · 2587 阅读 · 2 评论 -
R语言缺失值处理
缺失值1. is.na 确实值位置判断注意: 缺失值被认为是不可比较的,即便是与缺失值自身的比较。这意味着无法使用比较运算 符来检测缺失值是否存在。例如,逻辑测试myvar == NA的结果永远不会为TRUE。作为 替代,你只能使用处理缺失值的函数(如本节中所述的那些)来识别出R数据对象中的缺 失值。2. na.omit() 删除不完整观测3. knnImputation K近邻填补原创 2015-03-24 17:44:21 · 31980 阅读 · 1 评论 -
优化R程序性能
system.time()时间测定Rprof和profr性能分析R语言性能监控工具Rprof How to efficiently use Rprof in R?library(profr)#日志存放路径file<-"fun1_rprof.out"Rprof(file)trainAndtest(mp_id[1])#被检测程序Rprof(NULL)#显示日志summaryRprof(f转载 2015-04-23 11:05:15 · 1523 阅读 · 0 评论 -
skcd
# library(xkcd)# vignette("xkcd-intro")# xkcdFontURL <- "http://simonsoftware.se/other/xkcd.ttf"# download.file(xkcdFontURL,dest="xkcd.ttf")# # font_import(".") ## because we downloaded to workin原创 2015-08-21 16:16:34 · 452 阅读 · 0 评论