R
文章平均质量分 62
alphabeta12345
这个作者很懒,什么都没留下…
展开
-
ubuntu上编译安装R
R编译安装其中 --prefix=/home/vobile/R-2.15.3 为R的安装路径 --enable-R-shlib可以保证lib目录下的动态库能够共享原创 2014-12-23 21:47:44 · 1184 阅读 · 0 评论 -
R语言爬虫之——RCurl
RCurl作者Duncan Temple Lang 现任加州大学 U.C. Davis分校副教授 致力于借助统计整合进行信息技术的探索RCurl的概述The RCurl package is an R-interface to the libcurl library that provides HTTP facilities. This allows us to download files原创 2015-03-15 22:13:42 · 50473 阅读 · 4 评论 -
R语言字符串处理函数之——字符串的大小写转换
toupper转化为大写字母toupper(x=c("apple", "I like your style"))[1] "APPLE" "I LIKE YOUR STYLE"tolower转化为小写字母tolower(x="APPLE")[1] "apple"原创 2015-03-15 22:33:43 · 20258 阅读 · 0 评论 -
R语言函数union、setdiff、insect
union求两个向量的并集 集合可以是任何数值类型union(x=1:3, y=2:5)[1] 1 2 3 4 5union(x=c("abc", "12"), y=c("bcd", "efg"))[1] "abc" "12" "bcd" "efg"setdiff求向量x与向量y中不同的元素(只取x中不同的元素) setdiff(x, y)setdiff(x=1:4, y=2:3)[1原创 2015-03-15 22:13:05 · 36529 阅读 · 0 评论 -
R语言之——字符串处理函数
nchar字符长度函数nchar("abcd")[1] 4paste字符串粘合函数paste("abc", "efg", "hijk", sep = "-")[1] "abc-efg-hijk"substr字符串截取函数substr(x = "hello", start = 1, stop = 2)[1] "he"strsplit字符串的分割函数,可以指定分割符,生成一个liststrspli原创 2015-03-15 21:18:57 · 26306 阅读 · 0 评论 -
R语言日期时间处理
日期时间处理##把这样的字符串,转换为日期类型Sys.setlocale("LC_TIME", "C") ##非常重要d1 [1] "23/Nov/2014:23:21:02" "23/Nov/2014:23:04:56" "23/Nov/2014:23:33:49" [4] "23/Nov/2014:23:15:38" "23/Nov/2014:23:40:46" "23/Nov/201原创 2015-02-27 11:35:21 · 2820 阅读 · 0 评论 -
R语言函数之——ifelse
ifelse----向量化的函数----在向量赋值的时候,特别有用,如下面例子> x <- 1:10> y 5, 0, 10)> y [1] 10 10 10 10 10 0 0 0 0 0把向量中的NA换为0> x <- c(1, 2, NA, NA, 5)> x[1] 1 2 NA NA 5> x <- ifelse(is.na(x), 0,原创 2015-02-12 19:57:45 · 50365 阅读 · 0 评论 -
linux下安装Rstudio server,浏览器远程访问R
linux版本要求ubuntu10.04+Debian6+这里只是针对ubuntu和Debian的linux安装1、R语言安装安装Rstudio server要求R的版本为2.11.1或者更高版本的R2、针对Debian特别说明翻译 2015-01-05 11:32:56 · 7265 阅读 · 1 评论 -
R语言编写函数——豆瓣电影评分查询
作为一个伪影迷,经常纠结一些电影该不该下,要不要看。毕竟吾生也有涯而片源无涯。还好可以去豆瓣一类的地方看看大家的评分择优录用。去豆瓣查分需要登录网站搜索再鼠标点点点,如果要查好几部电影就有点费事儿。其实可以用R写个函数,先抓取相应的网页,再筛选返回需要的分值。这样在R里头就可以批量查分了,恩,走起来。library(RCurl)library(XML)movieScore <- function转载 2015-02-24 21:36:21 · 2526 阅读 · 0 评论 -
R语言中文分词jiebaR
简介“结巴”中文分词的R语言版本,支持最大概率法(Maximum Probability), 隐式马尔科夫模型(Hidden Markov Model), 索引模型(QuerySegment), 混合模型(MixSegment), 共四种分词模式, 同时有词性标注,关键词提取,文本Simhash相似度比较等功能。项目使用了Rcpp和CppJieba进行开发。特性支持 Windows , Linux操原创 2015-02-17 11:22:27 · 20112 阅读 · 0 评论 -
R语言做图plot参数
1、符号和线条 pch:指定绘制点所使用的符号,取值范围[0, 24],其中4是“差号”,20是“点” cex:指定符号的大小。cex是一个数值,表示pch的倍数,默认是1.5倍 lty:指定线条类型。lty=1代表实线,2至6都是虚线,虚的程度不一样 lwd:指定线条宽度,默认值为lwd=1,可以适当修改1.5倍、2倍等原创 2015-01-04 20:32:28 · 28068 阅读 · 0 评论 -
R 语言assign 和get 函数用法
R 语言 assign函数在循环时候,给变量赋值,算是比较方便原创 2015-01-20 19:58:11 · 33855 阅读 · 2 评论 -
R语言做图之——wordcloud
待续原创 2015-02-07 00:28:13 · 8394 阅读 · 0 评论 -
R 数据导入读取read.table函数详解
【R】数据导入读取read.table函数详解,如何读取不规则的数据(fill=T)函数 read.table 是读取矩形格子状数据最为便利的方式。因为实际可能遇到的情况比较多,所以预设了一些函数。这些函数调用了 read.table 但改变了它的一些默认参数。注意,read.table 不是一种有效地读大数值矩阵的方法:见下面的 scan 函数。一些需要考虑到问题是:编码转载 2015-01-21 10:58:04 · 21108 阅读 · 0 评论 -
R语言做图之——barplot
x beside = T, ylab = "单位%", col =brewer.pal(8, "Set1"), main = "收入累计百分比", names.arg = c("score1to60", "score1to70", "score1to75", "score1to80", "score1to85", "score1to90",原创 2015-02-07 00:27:03 · 7122 阅读 · 0 评论 -
R语言之——正则表达式
定义正则表达式是对字符串操作的一种逻辑公式。作用对象正则表达式的作用对象是文本。作用*逻辑过滤 *精准抓取特点灵活性、逻辑性和功能性非常强可以迅速地、用极简单的方式达到字符串的复杂控制语法规则\ 转义字符 . 除了换行以外的任意字符 ^ 放在句首,表示一行字符串的起始 $ 放在句尾,表示一行字符串的结束 * 零个或者多个之前原创 2015-03-21 13:15:44 · 8577 阅读 · 0 评论