R语言
探索者v
这个作者很懒,什么都没留下…
展开
-
R语言 数值前添加字母
R语言 数值前添加字母有时候我们需要为一个数值添加字母作为id,比如,1,2,3,4,…1003,前添加 “R”,需要改为R001, R002, R003, R004,…., R1003, 我们可以使用下面的代码#' Title#' 字母+数字的格式且保持长度相同#' @param x 数值向量#' @param flag 字母前缀, 默认为'R'#'#' @return 返回长度相同的字原创 2016-01-17 11:41:14 · 10073 阅读 · 2 评论 -
Feather R语言和Python交互式硬盘存储格式
本文最近更新地址 本文参考:http://blog.rstudio.org/2016/03/29/feather/R语言大神Hadley的有一力作:Feather。 Feature是一种文件格式,支持R语言和Python的交互式存储,速度更快。目前支持R语言的data.frame和Python pandas 的DataFrame。Feather收到了Apache arrow 项目的支持翻译 2016-04-07 20:12:22 · 9340 阅读 · 0 评论 -
ggplot2-一页多图(不同来源, 灵活绘制)
本文更新地址:http://blog.csdn.net/tanzuozhev本文在 http://www.cookbook-r.com/Graphs/Multiple_graphs_on_one_page_(ggplot2)/ 的基础上加入了自己的理解ggplot2 的分面(facet)可以绘制一页多图, 但是必须是来自同一个数据集的图形,局限性很大. 如果我们有多个不同来源的图形,想绘制到一张图翻译 2016-04-10 12:37:11 · 40322 阅读 · 4 评论 -
R语言手动计算主成分分析(PCA)及其在R函数的实现
R语言手动计算主成分分析(PCA)及其在R函数的实现了解PCA的原理,但总是无法用R语言实现,这次算是有个教程。 转自:http://blog.163.com/xiaoji0106@126/blog/static/13613466120133185842687/ 主成分分析(principal component analysis,PCA)是一种降维技术,把多个变量化为能够反映原始变转载 2016-05-04 00:38:29 · 25198 阅读 · 0 评论 -
ggplot2-为图形添加直线
ggplot2 为图形添加直线翻译 2016-04-10 12:02:41 · 91198 阅读 · 4 评论 -
ggplot2-分面(facet) 一页多图
ggplot2的数据分面就是根据数据中的不同分组,绘制多个图形.翻译 2016-04-10 12:26:38 · 47069 阅读 · 1 评论 -
ggplot2-设置图例(legend)
本文更新地址:http://blog.csdn.net/tanzuozhev/article/details/51106909本文在 http://www.cookbook-r.com/Graphs/Scatterplots_(ggplot2)/ 的基础上加入了自己的理解图例用来解释图中的各种含义,比如颜色,形状,大小等等, 在ggplot2中aes中的参数(x, y 除外)基本都会生成图例来解释翻译 2016-04-09 22:25:25 · 156383 阅读 · 4 评论 -
ggplot2-设置坐标轴
本文在 http://www.cookbook-r.com/Graphs/Axes_(ggplot2)/ 的基础上加入了自己的理解基本箱线图library(ggplot2)bp ggplot(PlantGrowth, aes(x=group, y=weight)) +翻译 2016-04-09 21:28:38 · 82614 阅读 · 2 评论 -
ggplot2-绘制散点图
ggplot2 绘制散点图翻译 2016-04-09 19:34:43 · 31057 阅读 · 0 评论 -
ggplot2-为折线图和条形图添加误差线
采用ggplot2绘制折线图和条形图,并添加误差线.ggplot2只能处理 data.frame数据,每列作为一个变量,是一个指标.以ToothGrowth数据为例,进行处理tg ToothGrowthhead(tg)## len supp dose## 1 4.2 VC 0.5## 2 11.5 VC 0.5## 3 7.3 VC 0.5## 4 5.8翻译 2016-04-09 16:58:56 · 70514 阅读 · 2 评论 -
PLSDA 构建 ROC曲线
plsda的计算使用R语言caret包中的plsda函数, 对数据进行pls后将回归预测值进行比较得到结果.PLSDA判别后会有两列(列数等于分类数),常规计算没有使用贝叶斯 第一列的概率使用: exp(col1_value)/(exp(col1_value)+ exp(col2_value)) 第二列的概率使用: exp(col2_value)/(exp(col1_value)+ exp原创 2016-02-29 23:26:35 · 9413 阅读 · 0 评论 -
ggplot2-条形图和折线图
http://blog.csdn.net/tanzuozhev/article/details/50822204本文在 http://www.cookbook-r.com/Graphs/Bar_and_line_graphs_(ggplot2) 的基础上加入了自己的原创 2016-03-07 20:49:17 · 41408 阅读 · 1 评论 -
R语言 plyr包 m_ply mdply
R语言 m_ply的使用plyr包也算得上是R语言的神器,可以并行,可以显示进程,尤其是可以自定义返回值。其中最长使用的是ldply, llply等单参数函数,今天想介绍多参数传递的函数m_ply、 mdply、maply、mlply。 m_ply 系列函数来源于基础包的 mapply 函数。mapply# 双参数 f = function(a, b){ return(c(2*a,原创 2016-01-27 23:46:50 · 7620 阅读 · 2 评论 -
数据的归一化(Normalization)、标准化(Standardization)
数据的标准化、中心化、归一化以及R语言中的scale本文参考: Gower (1985), Johnson and Wichern (1992), Everitt (1993), and van Tongeren (1995)http://stats.stackexchange.com/questions/10289/whats-the-difference-between-normalizati原创 2016-01-28 17:14:32 · 56069 阅读 · 2 评论 -
直接操作语言对象
直接操作语言对象本文转载自 http://www.biosino.org/R/R-doc/R-lang/Direct-manipulation-of-language-objects.html#Direct-manipulation-of-language-objects有三种语言对象可用于修改,调用,表达式和函数。 基于这种认识,我们集中讨论调用对象。就是有时称之为 “未求值表达式”(uneva转载 2016-01-28 20:18:20 · 5010 阅读 · 0 评论 -
R语言 substitute
R语言 substitute来自: http://www.biosino.org/R/R-doc/R-lang/Substitutions.html#Substitutions事实上,向上节内容中提到的一样,修改一个表达式内部结构是很少见的。 最常见的是,用户简单地想得到一个表达式以分析它并且用它 来作标记图形一类的事情。这样的一个例子可见于 plot.default 实现代码的起始部分:转载 2016-01-28 20:23:22 · 11974 阅读 · 1 评论 -
R语言 表达式对象的求值 eval
R语言 表达式对象的求值 eval模式为 “expression”的对象在Expression objects 有具体定义。它们和引用对象的列表非常相似。 > ex <- expression(2 + 2, 3 + 4) > ex[[1]] 2 + 2 > ex[[2]] 3 + 4 > eval(ex) [1] 7注意,对一个表达式对象求值会对每个调用依次求值, 但是最终的值是最后一转载 2016-01-28 20:24:37 · 15207 阅读 · 0 评论 -
R语言 非标准化求值(Non-standard evaluation, NSE)
R语言 非标准化求值(Non-standard evaluation, NSE)非标准化求值(Non-standard evaluation, NSE)在R语言中起着重要的作用,在交互式数据操作中可以简化操作。Hadley Wickham大神的ggplot2,dplyr,plyr 等神器均用到了NSE,但是理解起来比较困难,我们这里做简单介绍. 先来简单认识一下几个函数。substitute我们在原创 2016-01-28 22:09:47 · 11566 阅读 · 3 评论 -
R语言 dplyr传递参数
dplyr可以算得上是R语言的神器了,各种流式操作,让人爱不释手。dplyr 可以直接根据列名进行操作,也就是所谓的(Non-standard evaluation)这方便很多,同样也给我们自定义函数时的参数传递带来了麻烦。Non-standard evaluation NSE这是 R语言 lazyeval包中使用的一种方法,我自己也搞不明白,但是能大概理解代码。先举几个例子待续原创 2016-01-27 23:18:33 · 8917 阅读 · 1 评论 -
R语言发email
最近用大型机运行R, 运行时间很长, 不知道什么时候跑完. 发现一个好用的包 mailR(https://github.com/rpremraj/mailR), 其实也可以用飞信的API 给自己发短信(都是非官方的, 以前用过, 今天再看都过期了).那来介绍一下 mailRmailRSMTP 服务器(无需认证)send.mail(from = "sender@gmail.com",原创 2016-03-22 00:10:37 · 11799 阅读 · 1 评论 -
R语言神器
R pacakgedplyr数据处理神器, plyr的升级版,主要用于数据框,可以实现与数据库的快速交互。data.table读取文件,处理数据,速度比python,dplyr还要快。 就是语法上有些凌乱。reshape2, tidyr揉数据的法宝,将数据以不同的形式展现,列数由多变少, tidyr 是 reshape2 的升级版,主要用于数据框。readr2015-04-09 readr 发布,同原创 2015-06-17 18:10:54 · 15011 阅读 · 0 评论 -
ggplot2–绘制分布图
ggplot2–绘制分布图本文更新地址:本文在 http://www.cookbook-r.com/Graphs/Plotting_distributions_(ggplot2)/ 的基础上加入了自己的理解生成绘图数据set.seed(1234)dat data.frame(cond = factor(rep(c("A","B"), each=200)),翻译 2016-04-09 17:26:50 · 36948 阅读 · 0 评论