R
文章平均质量分 71
wa2003
这个作者很懒,什么都没留下…
展开
-
用R语言的RCurl和正则表达式爬团购网的旅游团购数据
用R里的包Rcurl,代码如下url='http://beijing.lashou.com/travel/menpiao' # web=readLines(url,encoding='UTF-8'); #逐行读取网页源文件head(web,10);goods_namehead(goods_name,1)[1] "【马驹桥】皕富园农场"goods_name",go原创 2015-04-28 21:53:05 · 1183 阅读 · 0 评论 -
R语言的告警”条件的长度大于一,因此只能用其第一元素“的解决办法
告警:”条件的长度大于一,因此只能用其第一元素“原因:向量和标量的问题举例:> x<-seq(-2,2); # x是个长度为5的向量> x[1] -2 -1 0 1 2> if(x>0) 1 else 0 [1] 0Warning message: 如果x的长度>1,只使用x的第一个元素,x的第一个元素是-2,所以输出是0In if (x > 0) 1 els原创 2015-07-09 14:34:52 · 53716 阅读 · 4 评论 -
networkD3包小试牛刀
力导向网络图这种图采用物理上的弹簧模型,将节点之间想象成是用弹簧连接的,然后把这些用弹簧连接的节点扔到桌面上,让这些弹簧自己弹啊弹,弹啊弹,最后总能停下来,达到一个平衡状态。这个状态下的节点连接图,能力最小,线和线之间的交叉最小。这种方法的学名叫spring-embedder 或者 force-directed。拖动中间的图里的任意节点,整个网络就会被拖动,并达到新的平衡位置。从图原创 2015-06-10 21:41:49 · 4886 阅读 · 0 评论 -
centos 6.5下安装及使用shiny server
RStudio公司自己构建了R Shiny Application运行的平台(http://www.shinyapps.io/ ), 用户可以通过RStudio上面的工具把自己编写调试好的Shiny Application上传到shinyapps.io上去(这里需要先注册和设置些东西)。这样构建了一个云端的服务器。但是有时还是有必要自己去构建一个自己的Shiny 服务器,这样操作起来还是方便些。原创 2015-05-25 11:45:18 · 2501 阅读 · 0 评论 -
RJDBC读MYSQL数据库读不出内容问题及解决
1、RJDBC对字符比较挑,没有配置好,则读不出内容,都出的空表,问题解决如下加上这个?useUnicode=true&characterEncoding=UTF-8即可。library(RJDBC)drvconndbListTables(conn); #列出所有的数据表LF原创 2015-06-08 08:06:51 · 1990 阅读 · 0 评论 -
RFM模型及R语言实现
一、基本概念根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(Recency)、消费频率(Frequency)、消费金额(Monetary)。 RFM模型:R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户原创 2015-09-09 10:53:31 · 10716 阅读 · 0 评论 -
excel文件,用read.xlsx别用read.csv了
read.csv,坑爹,老报错> a1=read.csv("communitty_add2.csv",sep=',',header=T,fileEncoding="UTF-8",encoding="UTF-8")Warning messages:1: In read.table(file = file, header = header, sep = sep, quote = quote原创 2015-08-07 09:00:11 · 14518 阅读 · 1 评论 -
【学习】R语言中的并行计算:foreach,iterators, doParallel包
我个人的理解,这些包进行并行计算,有点类似控制编译器的并行开关,将数据、循环变量直接的依赖性进行开关设置。一、foreach包foreach包是revolutionanalytics公司贡献给R开源社区的一个包,它能使R中的并行计算更为方便。与sapply函数类似,foreach函数中的第一个参数是输入参数,%do%后面的对象表示运算函数,而.combine则表示运算结果的整合原创 2015-09-06 10:09:19 · 15296 阅读 · 0 评论 -
SparkR跑通的函数(持续更新中...)
> a> head(a)> columns(a) # 列出全部的列[1] "city" "housingname" "ori_traffic_score" "ori_traffic_score_normal"[5] "metro_station" "metro原创 2015-07-06 17:40:39 · 2055 阅读 · 1 评论 -
centos 6.5下安装 rstudio server及问题解决
sudo yum install openssl098e原创 2015-05-26 13:12:18 · 2668 阅读 · 0 评论 -
Rmysql的安装及乱码解决
1、安装mysql-devel mysql-lib,不装这个后面装Rmysql会报错# sudo yum install mysql-server mysql-devel mysql-lib2、报错,有冲突Transaction Check Error: file /usr/bin/mysql from install of mysql-5.1.71-1.el6.x86_原创 2015-06-08 21:59:44 · 1030 阅读 · 0 评论 -
R语言绘制热图Heatmap
热图,适合二维数据表的可视化,数值用颜色显示。细活在于调颜色,给人感性的、辨识度高的认识。nba nba row.names(nba) nba nba_matrix nba_heatmap <- heatmap(nba_matrix, Rowv=NA, Colv=NA, col = topo.colors(16),scale="column", ma原创 2015-05-05 09:40:59 · 11787 阅读 · 0 评论 -
R中的高效批量处理函数(lapply sapply apply tapply mapply)
R语言提供了批量处理函数,可以循环遍历某个集合内的所有或部分元素,以简化操作。这些函数底层是通过C来实现的,所以效率也比手工遍历来的高效。批量处理函数有很重要的apply族函数:lapply sapply apply tapply mapply。apply族函数是高效能计算的运算向量化(Vectorization)实现方法之一,比起传统的for,while常常能获得更好的性能。原创 2015-05-21 09:01:07 · 58206 阅读 · 0 评论 -
Centos下R语言的出错及解决(持续更新中)
(1)安装RODBC包不能直接在R下用 install.packages("RODBC")安装。前提条件是先要用YUM安装两个包:# yum install unixODBC # yum install unixODBC-devel原创 2015-05-21 14:55:18 · 746 阅读 · 0 评论 -
centos 6.5下安装R 3.2.0
步骤:1,下载R-3.0.1.tar.gzhttp://cran.r-project.org/src/base/R-3/R-3.0.1.tar.gz2,解压$ tar -zxvf R-3.0.1.tar.gz$ cd R-3.0.13,编译(确保系统中安装了编译需要的包,如果没有安装,会报错。)$ ./configure4,安装$ make 这步原创 2015-05-21 08:42:26 · 2549 阅读 · 0 评论 -
rstudio server包的安装位置
1、在rstudio窗口,查看库文件的路径> .libPaths()[1] "/home/enn_james/R/x86_64-unknown-linux-gnu-library/3.2" "/usr/local/lib64/R/library"其中”/usr/local/lib64/R/library”这一路径就是所有用户共享library的地方,因此想要让共享一个库只要将包安装到原创 2015-06-02 09:26:45 · 6463 阅读 · 0 评论 -
leafletR的几个注意
1、toGeoJSON挑字符格式乱码一定要清除掉,否则出差,尤其是互联网爬的数据,要用正则去处理。常用的清理方法如下:hp.df$loupanmingcheng<-gsub("[^a-zA-Z0-9\u4e00-\u9fa5]","",hp.df$loupanmingcheng); #替换乱码;# [\u4e00-\u9fa5] 匹配汉字-汉字的正则表达式; [\a-zA-Z0原创 2015-06-23 11:11:03 · 1573 阅读 · 0 评论 -
centos 6.5下安装rstudio server【总结】
(一)、几个前提条件:1、先安装R,如果是从源码安装的,需要用参数 --enable-R-shlib。2、安装RStudio是,会去找R的安装位置,默认的是 /usr/bin/R,或 /usr/local/bin/R,如果R装在其他位置,可能找不到,有问题。3、记得修改/etc/rstudio/rserver.conf配置文件指定R的目录,在rserver.conf中添加rs原创 2015-05-21 15:29:30 · 2560 阅读 · 0 评论 -
R的交互式时间序列包dygraphs
1、 dygraphs 是一个开源的Javascript库,它可以产生一个可交互式的,可缩放的的曲线表。其可以用来显示大密度的数据集(比如股票,气温,等等),并且可以让用户来浏览和解释这个曲线图。2、 R中的时间序列格式有好多种,如ts, xts, zoo,但dygraphs只支持xts格式的。3、zoo作为时间序列的基础库,是面向通用的设计,可以用来定义股票数据,也可以分析天气数据。原创 2015-05-10 22:13:40 · 3994 阅读 · 0 评论