R
xwydq
这个作者很懒,什么都没留下…
展开
-
R语言base包中的summary函数灵异了
今天使用summary()查看一组数据,主要看看年份的分布情况,数据明明显示有3个年份,约60多万条记录;但是使用summary()得到的结果显示都为同一个年份,而table()函数也可以正确的显示该数据的分布情况。尝试了一下的验证方法:1,对数据先使用as.numeric\ as.integer后再summary()依然无效;fivenum()有效正常显示2,使用write.csv(原创 2013-09-21 10:45:05 · 3760 阅读 · 0 评论 -
使用R画桑基图(流程图)
桑基图可以用来表示各个节点之间转换在R中可以直接定义点点之间的关系后使用相应的package画桑基图:方法一:riverplotlibrary(riverplot)# 构造连接节点的数据框edges = data.frame(N1 = paste0(rep(LETTERS[1:4], each = 4), rep(1:5, each = 16)),原创 2015-04-09 17:32:04 · 26657 阅读 · 2 评论 -
ggplot2实现多图合并
multiple plots in one pagecookbook-R-multiplot# Multiple plot function## ggplot objects can be passed in ..., or to plotlist (as a list of ggplot objects)# - cols: Number of columns in la原创 2015-04-15 18:04:37 · 45545 阅读 · 0 评论 -
关联度画图(qgraph包的实现)
关联度画图(qgraph包的实现)library("semPLS")data(mobi)# descriptive names for graph nodesnames(mobi)<-c("QualityExp", "MeetNeedsExp", "GoWrongExp", "Over转载 2015-10-30 15:16:54 · 5172 阅读 · 2 评论 -
R性能优化
程序性能剖析确定程序运行时间利用system.time:system.time(for (i in 1:50) mad(stats::runif(500)))利用proc.time:ptm proc.time()for (i in 1:50) mad(stats::runif(500))proc.time() - ptm性能监控的函数R转载 2015-11-16 09:45:27 · 1737 阅读 · 0 评论 -
R read.table Error:appears to contain embedded nulls
R语言使用 read.table 报错Error:appears to contain embedded nulls解决方法:1)使用readLines 速度极慢2)给read.table添加参数skipNultest <- read.table("D:/part-r-00000")# Error in read.table("D:/part-r-0原创 2015-11-24 16:22:30 · 19917 阅读 · 0 评论 -
shiny-server 安装与配置、问题汇总
shiny-server 安装与配置、问题汇总1 安装环境:centos6.51.1 安装R$ sudo yum install R1.2 进入R,安装包shiny,rmarkdowninstall.packages('shiny')install.packages('rmarkdown')1.3 安装shiny-server$ wget https://download3.rstud原创 2016-04-01 10:57:00 · 3783 阅读 · 0 评论 -
R使用图片为背景画图
base-plot参考地址: 参考1; 参考2pnglibrary(png)download.file("http://rprogramming.net/wp-content/uploads/2012/10/R-Programming.png", "R.png")image <- readPNG("R.png")plot(1:2, type="n", main="Plotting Ove原创 2016-04-01 13:10:04 · 3306 阅读 · 0 评论 -
R画图中常见15个问题
原文链接1. How To Draw An Empty R Plot?How To Open A New Plot FrameYou can open an empty plot frame and activate the graphics device in R as follows:plot.new() # or f转载 2016-03-28 21:00:03 · 8254 阅读 · 0 评论 -
shiny分级菜单实现
本文主要目的实现R shiny中的分级菜单选择地区A之后,再选择A地区的门店(下拉选项中只显示A地区门店)实现效果代码 global.Roptions(stringsAsFactors=FALSE, scipen=10, digits=4)library(dplyr)df_sample <- data.frame(region=rep(LETTERS[1:3], 4),原创 2016-04-14 16:59:51 · 4882 阅读 · 1 评论 -
shiny分级更新dataframe数值实现
使用shiny实现对年、季度、月取值的连锁更新实现目标点击按钮年预算更新对所有的提升百分比更新 点击按钮季度预算更新对对应季度以及季度对应的月份的提升百分比更新 点击按钮月份预算更新对对应月份的提升百分比更新代码 global.R# 小数转化为百分数输出numtop <- function(num, p=2){ num1 <- num * 100 formt <- paste0(原创 2016-04-14 18:01:36 · 1957 阅读 · 0 评论 -
R packages: dplyr拾遗
dplyr是HW的数据处理的利器dplyr的介绍dplyr备忘:distinct去重distinct(select(flights, tailnum))#> Source: local data frame [4,044 x 1]#> #> tailnum#> (chr)#> 1 N14228#> 2 N24211#> 3 N619AA#> 4 N80原创 2016-04-18 09:36:46 · 1394 阅读 · 0 评论 -
centos 6.5 安装配置R问题记录
R画图中文乱码出现麻将字样的乱码可能是由于字体设置引起$vi /etc/sysconfig/i18nLANG="zh_CN.UTF-8"SUPPORTED="zh_CN.GB18030:zh_CN:zh:zh_CN.GB2312:en_US.UTF-8:en_US:en"#SYSFONT="latarcyrheb-sun16"修改对应用户的家目录路径$userm原创 2015-10-08 11:17:38 · 959 阅读 · 0 评论 -
R调用BaiDu地图API
由于ggmap不能正常使用考虑使用R调用百度地图的APIR中调用地图接口的方法在R中本来可以直接使用Google地图对应的包RgoogleMaps;ggmap参考:http://cran.r-project.org/web/packages/RgoogleMaps/RgoogleMaps.pdfhttp://www.r-bloggers.com/google原创 2015-04-16 17:10:10 · 14644 阅读 · 3 评论 -
R置换检验
R置换检验置换检验permutation test介绍R中的permutation test(1) R函数代码#################### function##############################treatment_effects <- function(df, var){ # length of variable原创 2015-04-09 18:02:04 · 2146 阅读 · 0 评论 -
dplyr分组后返回多值的处理
lapply函数使用之前需要对原始数据拆分为list的结构(使用split函数),而拆分的过程当数据量稍大时速度很慢by_species % mutate(Sample=sample(LETTERS[1:4], size=150, replace = T))by_species % group_by(Species) %>% select(Species, Sample原创 2015-04-15 16:48:15 · 1462 阅读 · 0 评论 -
R升级到R 3.0.2
点击打开链接R升级到了3.0.2同时RStudio也升级到RStudio 0.98.313# installing/loading the package installr:if(!require(installr)) { install.packages("installr"); require(installr)} #load / install+load inst原创 2013-10-08 17:05:40 · 2433 阅读 · 0 评论 -
发现matrix的一点小小优势
一直以来,在R中使用data.frame处理数据跟方便,大多数统计函数直接支持data.frame类型的运算。虽说在R中药尽可能避免使用循环,but~~~~循环还是不经意间就出现了~~~~今天对一个例子测视力下,R循环中使用matrix的速度明显大于使用data.frame。有如下简单循环代码:test <- matrix(0, nrow=1000, ncol=50)system.t原创 2013-09-22 21:17:33 · 940 阅读 · 0 评论 -
pdf()中文乱码问题解决
点击打开链接library(Cairo)CairoPDF("pentagram.pdf");par(family = "simsun")plot(3, 3, type = "n", main = "五角星");points(3, 3, pch = "☆", cex = 2, col = "blue");dev.off()转载 2013-09-23 17:40:58 · 3675 阅读 · 0 评论 -
R 中 paste的使用
R中关于字符串处理的一些资料:点击打开链接点击打开链接在画图是有label;main等太长,常使用paste将其换行。如:paste("I LOVE R", "\n", "R is GREAT")但是其在命令行的显示并没有换行[1] "I LOVE R \n R is GREAT"而在图形中却可以正确显示:plot(rnorm(100原创 2013-10-24 21:58:52 · 10420 阅读 · 0 评论 -
R函数在数据预处理、数据准备过程中的使用
数据准备是数据分析工作的绝大部分,所消耗的时间约占80%以上,因此如何有效的提高处理的速度是很有必要的。R不但是用于分析建模的好工具,在数据预处理方面也有很多便捷的函数使用:1- apply类函数的使用(R中最好减少loops)apply类函数使用:matriz <- matrix(round(runif(9,1,10),0),nrow=3)apply(matri原创 2013-11-01 07:44:22 · 1209 阅读 · 0 评论 -
关于LaTeX + LyX + R/Sweave + pgfSweave + PDF图形的若干中文问题(使用knitr画图时中文乱码解决)
http://yihui.name/cn/2010/02/misc-issues-in-latex-lyx-r-sweave-pgfsweave/找到好苦啊!! \documentclass[twoside,UTF8]{ctexart} \usepackage[T1]{fontenc} \usepackage{CJKutf8} \usepackage[letterpaper]{geo转载 2013-11-26 22:27:24 · 2396 阅读 · 0 评论 -
R lazy evaluation
Advanced R Programming以上为R高级编程的地址。今天看到function部分有一些好玩的机制想在此记录下来。By default, R function arguments are lazy - they're only evaluated if they're actually used:默认情况下,R函数的参数只有在真正使用时才会执行。但是感觉这翻译 2013-11-28 21:00:45 · 1024 阅读 · 0 评论 -
R中data.table与dlyr的使用
# 生成实验数据set.seed(1234)smalldat <- data.frame(group1 = rep(1:2, each = 5), group2 = rep(c('a','b'), times = 5), x = rnorm(10))# convert to data.frame翻译 2014-01-07 10:17:15 · 2601 阅读 · 0 评论 -
列出已经R中安装的package的命令
pkgs <- sort(.packages(all.available = TRUE))length(pkgs)pkgs转载 2014-01-08 15:34:12 · 1926 阅读 · 0 评论 -
ggplot2常用画图示例
library(ggplot2)library(gridExtra)mtc <- mtcarshead(mtc)ggplot(mtc, aes(x = factor(gear))) + geom_bar(stat = "bin")##PART1 Aggregate data for barplot#using aggregateag.mtc<-aggregate(mtc$wt,转载 2014-01-10 09:49:35 · 3115 阅读 · 0 评论 -
R语言实现传统数学概念中的四舍五入
最近被R中的round函数搞得郁闷,有人说round函数的规则是如此定义的:引用cos 版主肖楠:这个规则有个俗名叫「四舍六入五凑偶」,也叫「银行家舍入」,完整版如下:1. 被修约的数字等于或小于 4 时,该数字舍去;2. 被修约的数字等于或大于 6 时,则进位;3. 被修约的数字等于 5 时,要看 5 前面的数字,若是奇数则进位,若是偶数则将 5 舍掉,即修约后末尾数字都成为偶数原创 2014-03-28 11:03:25 · 11512 阅读 · 3 评论 -
R语言选择导入文本数据部分字段
背景:文本数据字段太多,只需要读取有用字段,以此降低内存压力方便分析参考:Only read limited number of columns in R方法一:read.table、read.csv 直接使用自带函数设定适当的参数(colClasses),该参数需要指定每列数据的类型(可以使用nrows参数读取几行查看class),不需要的列指定为NULL即可原创 2015-02-06 16:48:38 · 4547 阅读 · 0 评论 -
win7下安装ROracle
win7下安装R的ROracle来连接Oracle数据库速度比ODBC的方式快很多安装配置也比较简单,但是有个问题:同时使用PL/SQL(32bits)与R(64bits,当然完全可以使用32位的,但是32的有保存使用限制~~~~~)。本配置的目的就是同时兼顾以上两者:一、ROracle、Oracle instantclient下载(1)ROracle下载ROracle原创 2015-02-11 17:47:55 · 1381 阅读 · 0 评论 -
Linux下安装ROracle及rstudio-server使用ROracle中文乱码解决
该安装文档在red hat 6.3及centos 6.5有过测试且成功。一、oracle-instantclient的安装(1) Oracle Instant Client下载(与数据库版本一致)下载地址:官网可以下载rpm包或者zip包进行安装,这里已rpm包(64位)为例;下载rpm 包csdn下载地址oracle-instantclient11.2-basi原创 2015-02-11 16:29:49 · 3431 阅读 · 0 评论