R语言
learneraiqi
南京信息工程大学-数学与统计学院-统计学
展开
-
决策树——CART——之R语言rpart包
本文主要介绍,如何使用R预言的rpart包做决策树的class分类。本人也是刚刚开始专注于使用R语言,所以文章写的比较浅显易懂,没有使用过R的人,根据文章操作,大部分人都能上手,如果是有编程经验的人,就更加容易了。博文有很多不足之处,望大牛多多指点,不甚感激!原创 2015-03-28 13:02:04 · 37919 阅读 · 7 评论 -
java通过rJava调用R失败的问题总结
尝试使用Java通过rJava来调用R,但是一直出现如下错误Cannot find JRI native library!Please make sure that the JRI native library is in a directory listed in java.library.path.网上找了许多解决方法,总结一下原因就是jri.dll有两个,一个是32的原创 2015-08-24 18:24:21 · 4157 阅读 · 0 评论 -
SparkR的安装配置
1. SparkR的安装配置1.1. R与Rstudio的安装1.1.1. R的安装我们的工作环境都是在Ubuntu下操作的,所以只介绍Ubuntu下安装R的方法:1) 在/etc/apt/sources.list添加源deb http://mirror.bjtu.edu.cn/cran/bin/linux/ubuntu p转载 2015-07-06 14:34:26 · 2389 阅读 · 1 评论 -
rstudio-server安装问题解决笔记
1、目标及问题在linux上安装R语言,并安装rstudio-server,使用web UI进行R的代码编写。源码编译安装的时候问题不大,能够进入rcmd中,进行相关操作,但是rstudio-server安装时问题就比较多了,结果就是rstudio-server启动不起来,web界面打不开。2、R的源码编译安装这个比较简单,从R的官方网站上下载R的linux版本,地址:http:/原创 2015-07-06 15:45:49 · 10873 阅读 · 1 评论 -
R语言字符串处理(2)
R语言处理文本的能力虽然不强,但适当用用还是可以大幅提高工作效率的,而且有些文本操作还不得不用。高效处理文本少不了正则表达式(regular expression),虽然R在这方面先天不高效,但它处理字符串的绝大多数函数都使用正则表达式。0、正则表达式简介:正则表达式不是R的专属内容,所以用0编号,这里也只简单介绍,更详细的内容请查阅其他文章。正则表达式是用于描述/匹配一个转载 2015-05-26 09:17:54 · 1823 阅读 · 0 评论 -
用R语言画柱状图
柱状图:源码:slices names png("r-graph-sample.png")barplot(beside=TRUE,slices,#纵轴取值names.arg=names,#边框名字border="black",#边框颜色col=c("purple","green3","blue","red"),#框内线转载 2015-07-01 15:14:23 · 15537 阅读 · 0 评论 -
R语言将源码包编译为二进制文件
1、背景介绍我们在安装R语言的packages时,有时会遇到包not available的情况。这是因为,该包没有提供windows安装所使用的二进制文件。如果我们想要使用该包,则需要自己手动编译。2、准备工作我是用的环境是:系统:win8R版本:3.2.0IDE:Rstudio安装RtoolsRtools下载地址:http:原创 2015-06-03 12:25:08 · 4714 阅读 · 5 评论 -
R语言解析JSON格式数据文件
互联网数据分析,避免不了接触JSON格式的数据集,而对于R语言来做分析来说,很显然这种数据格式不适合分析。所以,对JSON个数据进行解析,使其符合我们分析时常用的数据集,如data.frame,list。首先要感谢诸位默默无闻的大牛,已经为我们做好了这些工作,jsonlite包可以实现JSON个数据的解析。本文主要介绍了jsonlite中常用的几个函数,大家参考一下,然后利用帮助文档中的example很容易学会的。原创 2015-05-19 16:56:45 · 18027 阅读 · 0 评论 -
R语言离线安装二进制包的几个问题
由于公司网络使用代理,有时候在Rstudio中直接使用install.packages()从CRAN上安装包会出现无法连接到网络的问题。这时,我们要从R语言的官网上下载适合windows安装的二进制文件,使用离线安装的方式来装包。之前,一直网络安装,最近出了问题,尝试离线安装一直不成功,后来找到了解决方法,至于原因,依然在探索中。原创 2015-06-03 12:23:27 · 3755 阅读 · 0 评论 -
R语言包相关命令
R的包(package)通常有两种:1 binary package:这种包属于即得即用型(ready-to-use),但是依赖与平台,即Win和Linux平台下不同。2 Source package: 此类包可以跨平台使用,但用之前需要处理或者编译(compiled)。.libPaths():查看包的安装目录library():查看已经安装的包目录installed.pack转载 2015-06-04 11:21:41 · 2415 阅读 · 0 评论 -
在R中统计数据的频数或者密度分布并图形化
在进行数据分析之前,我们往往要首先对数据有一个大致的了解。对于统计性的数据,最好首先看看数据是如何分布,并把分布图示化,可以帮助我们确定后续的分析策略。现在,以R中著名的iris数据为例来计算其中一组数据的分布情况。> data(iris)> names(iris)[1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.W转载 2015-05-22 11:01:05 · 11949 阅读 · 0 评论 -
R语言Data Frame数据框常用操作
Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的。Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那么就是从1开始自增的Sequence来标识每一行。初始化使用data.frame函数就可以初始化一个Data Frame。比如我们要初始化一个stu转载 2015-05-21 14:53:42 · 10397 阅读 · 0 评论 -
R语言时间、日期处理
1. 日期通常以字符串的形式输入到R中,然后转化为数值形式存储的日期变量,函数as.Date()用于执行这种转化,其语法为as.Date(x, "input_format"),其中x是字符型数据,input_format则是读入日期的适当格式。%d 数字表示的日期(0~31) 例如01~31%a 缩写的星期名 例如Mon%A 非缩写的星期名 例如Monday%m 月份(00~12)转载 2015-05-27 10:30:11 · 26057 阅读 · 0 评论 -
字符串处理函数 R语言
用于字符串分割的函数:如strsplit('123abcdefgabcdef','ab')[[1]][1] "123" "cdefg" "cdef" #字符串连接:paste() #paste(..., sep = " ", collapse = NULL)#字符串分割:strsplit() #strsplit(x, split, ext转载 2015-05-15 14:51:36 · 1021 阅读 · 0 评论 -
朴素贝叶斯分类——R语言e1071 and klaR包初体验
本文主要学习使用R语言中的klaR包与e1071包中的朴素贝叶斯分类函数,数据使用的仍是上篇文章中从UCI上下载的bank数据下载地址:http://archive.ics.uci.edu/ml/datasets/Bank+Marketingbank <- read.csv("D:/data/MachineLearning/bank/bank.csv",header=T,sep=";"原创 2015-03-31 17:33:26 · 16373 阅读 · 4 评论 -
时间序列相关函数
【资料】文档1:《R与金融时间序列分析常见问题集》【包】library(zoo) #时间格式预处理library(xts) #同上library(timeSeires) #同上library(urca) #进行单位根检验library(tseries) #arma模型lib转载 2015-08-25 17:16:13 · 3282 阅读 · 0 评论