R
文章平均质量分 89
qy_microbiota
这个作者很懒,什么都没留下…
展开
-
编程模板-R语言脚本写作:最简单的统计与绘图,包安装、命令行参数解析、文件读取、表格和矢量图输出
写在前面个人认为:是否能熟悉使用Shell(项目流程搭建)+R(数据统计与可视化)+Perl/Python等(胶水语言,数据格式转换,软件间衔接)三门语言是一位合格生物信息工程师的标准。之前分享过我个人的Shell语言和Perl语言脚本写作模板,今天再分享一下我的R语言模板,一次性解决困扰新手的众多问题,如包安装、命令行参数解析、文件读取、Anova组间统计和箱线图展示、表格和矢量图输出等转载 2018-01-30 13:20:40 · 577 阅读 · 0 评论 -
ggplot2读书笔记4:图层的使用(二)群组几何对象和曲面图
除了添加注释、标签等之外,使用图层还可以完成箱线图、多边形等等多种群组几何对象类型的图,还可以绘制曲面图等。所以,今天继续学习图层的使用~4. 群组几何对象(Collective Geoms)在ggplot2中,几何对象大致可以分为个体(individual)几何对象和群组(collective)两种类型。群组几何对象可以多角度的展现数据结果。group(分组)这种图形属性...原创 2018-03-04 17:01:43 · 3660 阅读 · 0 评论 -
ggplot2读书笔记13:第十章 数据变换
Data Transformation10.1 简介通常情况下,除了整理数据之外,我们还需要把原始数据做一些数据变换(聚合等),这时就要使用到dplyr包。本章中我们学习dplyr中四个重要的函数的用法:filter()mutate()group_by()summarise()这些动词都是用相同的方式工作:将数据框作为第一个参数,然后返回一个修改后的数据框本章...原创 2018-03-18 16:36:07 · 704 阅读 · 0 评论 -
R语言笔记5:控制结构
Control Structures in RR语言中控制结构可以用来控制程序的执行流程常见控制结构的命令:if and else: 测试逻辑条件for: 用于执行固定次数的循环while: 用于在某个条件成立时执行循环repeat: 执行无限循环break: 终止并跳出循环next: 跳过循环中的当前迭代return: 从函数中退出If-else如果条件成...原创 2018-03-18 16:37:34 · 1730 阅读 · 0 评论 -
ggplot2读书笔记5:工具箱——误差线、加权数、展示数据分布
今天我们学习第三章的最后几节,其中的“绘制地图”部分,因为我木有顺利安装maps package,而且在我们的工作中也不常用,暂时跳过。下面继续~6. 添加误差线和误差范围数据中的不确定信息的展示也很重要。ggplot2中,四类几何对象可以用于这项工作,这取决于x的值是离散型还是连续型,以及我们是否想展示区间中的中心值:离散型变量+区间:geom_errorbar()...原创 2018-03-05 17:17:40 · 4974 阅读 · 0 评论 -
ggplot2读书笔记10:第七章 定位(分面和坐标系)
Positioning7.1 简介本章主题是图形的定位。定位由四个部分组成,前两个在前期讲过,而后两个部分在这章中会详细说到:位置调整:调整每个图层中出现重叠的对象的位置位置标度:控制数据到图形的映射分面:在一个页面上自动摆放多个图形。将数据分为多个子集,然后将每个子集依次绘制到不同面板上 坐标系:控制两个独立的位置标度形成一个二维坐标系,如笛卡尔坐标系7.2...原创 2018-03-13 09:02:55 · 1384 阅读 · 0 评论 -
ggplot2读书笔记11:第八章 主题设置、存储导出
Themes8.1 Introduction第八章讲的是ggplot2的主题设置,通过它你可以对数据之外的图形外观进行控制。第一版的中文版的把这一章的章节名翻译为“精雕细琢”。控制主题设置主要有以下四个方面:主题元素,指的是非数据元素,plot.title控制标题的外观,axis.ticks.x控制x轴的刻度,legend.key.height控制图例中按键的高度。元素函数...原创 2018-03-14 10:40:20 · 1825 阅读 · 0 评论 -
ggplot2读书笔记12:第九章 数据分析
本书的最后一个部分,Part III,Data Analysis。主要包括三个章节,今天先来看第九章:Data Analysis9.1 简介在前面的学习中,我们使用的模拟数据集都是已经整理好的数据框,可以直接使用。但通常实际数据并不会这么理想,需要通过一定的整理好变换才能用于作图所以这个部分的目标就是把ggplot2和其他工具结合起来,用于完整的数据分析。首先...原创 2018-03-14 16:43:35 · 659 阅读 · 1 评论 -
R语言笔记6:在R中写一些简单的函数
Your first R function 命令一个函数时,一般不写在交互式命令行里,而是写在一个空白的文本文件中,即把函数放在一个R包中,这里面包含着文档(documentation),是一个更加结构化的环境。 我们使用的软件是RStudio,左上角新建一个新的R脚本来写代码。Example 1举个例子,简单了解一下如何使用函数的语法、如何指定参数以及如何返回结果...原创 2018-03-21 14:02:55 · 4745 阅读 · 0 评论 -
ggplot2读书笔记3:图层的使用(一)图层基础、加标签和注释
使用图层的三个主要目的:展示数据:绘制原始数据时唯一的一层(数据层)展示数据的统计摘要:在数据背景下展示模型的统计预测效果,模型层通常绘制在数据层之上添加额外的元数据(metadata)、上下文信息和注释:也称背景层,了解数据的背景信息或强调数据中的某些特征,一般在最后绘制。1. 基本图形类型几何对象是ggplot2的基本组成部分,可以独立构建图形。他们都是二维的,主要函数...原创 2018-03-02 17:28:37 · 9921 阅读 · 2 评论 -
ggplot2读书笔记9:第六章 标度(二)
今天来学习第六章标度部分的最后一节~6.6 标度工具箱(Scales Toolbox)除了调整标度的默认选项之外,你也可以重新创建新的标度,主要分为以下四类:连续型位置标度:用于将整数、数值、日期/时间数据映射到x轴或者y轴的位置上;颜色标度:用于将连续型或离散型变量映射到颜色;手动离散型标度:将离散型变量映射到你选择的大小、形状、颜色、线条等;同一型标度:当你的数...原创 2018-03-09 17:12:16 · 3200 阅读 · 0 评论 -
R语言笔记1:R语言对象的数据类型(向量、数组、矩阵、 列表和数据框)
R语言中的数据类型(Data Types)R语言的对象(Objects)主要包括向量、矩阵、数组、数据框和列表。R语言的对象有五种最基本的类型,即,字符型(character)、数值型(numeric,包括小数)、整型(integer)、复数型(complex)以及逻辑型(logical,TRUE/FALSE)属性是R语言对象的一部分。主要包括以下几种:名字(names,dimna...原创 2018-02-26 15:31:00 · 12881 阅读 · 0 评论 -
R语言笔记2:读写数据所需的主要函数、与外部环境交互
Getting Data In and Out of R(一)读取数据读取数据所需的几种函数:read.table、read.csv:最常用的读取列表数据函数,可返回数据框形式。readLines:逐行读取文本文件,返回一个字符向量source:读取R代码、脚本dget:读取R代码(读取的是以逆句法分析后以文本文件储存的R对象)load、unserialize:把二进...原创 2018-02-27 13:17:21 · 2876 阅读 · 0 评论 -
R语言笔记3:提取R对象的子集,模糊匹配和移除数据框缺失值
Subsetting R Objects取子集的三种基本方法[ :“单方括号”返回的对象和原来相同,如向量的子集还是向量;也可用于在对象中选择多个元素[ [:“双方括号”仅可用于提取单一元素,并且用来提取列表或者数据框中的元素,但是,由于列表或者数据框中的元素类别不唯一,因此它返回对象的类型不一定是列表或者数据框$ :“美元符号”是提取有名字的列表或数据框中的一个元素...原创 2018-02-28 10:07:15 · 6247 阅读 · 0 评论 -
R语言笔记4:向量化运算
Vectorized OperationsR中许多操作可以通过向量化变得更加简洁。例如将两个向量加在一起:> x <- 1:4> y <- 6:9 > z <- x + y> z[1] 7 9 11 13相比写循环更加简便:> x <- 1:4> y <- 6:9 > w <-...原创 2018-02-28 19:31:53 · 1161 阅读 · 0 评论 -
ggplot2读书笔记6:第四章 语法 基础理论
碎碎念ing:终于结束了《ggplot2》的第一部分“Getting Started”,今天开始看第二部分——语法,第四章(Mastering the Grammar)介绍了ggplot2的一些基础语法知识,大概是对前期内容在理论上做一个总结。建立一个散点图首先还以“耗油量”数据集(mpg)为例。library(ggplot2)mpg# A tibble: 234 ...原创 2018-03-08 16:40:49 · 535 阅读 · 0 评论 -
ggplot2读书笔记7:第五章 通过图层构建图像
Build a Plot Layer by Layer5.1 简介(略)5.2 创建图表(以汽车耗油量mpg数据集为例)当我们使用ggplot()创建图表时,最基本的代码是:ggplot(mpg, aes(displ, hwy)) + geom_point()实际上这条代码包含了两步命令:第一个是:p <- ggplot(mpg, ae...原创 2018-03-08 16:45:33 · 2428 阅读 · 1 评论 -
ggplot2读书笔记8:第六章 标度(一)
Scales, Axes and Legends6.1 简介标度(scale)是将数据的取值映射到图形空间,例如颜色、大小和形状表示不同的数值。展现标度的常见做法是绘制图例和坐标轴。每一种标度都是从数据空间的某个区域(标度的定义域)到图层属性空间的某个值域(标度的值域)的一个函数。标度的定义域赌赢者提供给这个标度的变量的取值范围。定义域(变量)可以是连续型、离散型、有序或者无序...原创 2018-03-08 16:47:17 · 1202 阅读 · 0 评论 -
R语言笔记7:functions——编写函数所需的基础知识
上一讲通过三个简单的例子体验了一下如何在R中写函数,下面来详细学习有关R语言中函数的知识。Functions in R主要分三个部分来讲解函数:编写函数所需的基础知识相关语法作用域R语言作用域的规则编写函数所需的基础知识R语言通过function()指令来命名和创建函数。首先要给函数赋值,也就是命名,然后在小括号中写入参数,最后再大括号中写入函数要执行的...原创 2018-03-21 14:03:23 · 101865 阅读 · 0 评论