R语言中的管道操作
这是R数据科学的读书笔记之一,《R数据科学》是一本教你如何用R语言进行数据分析的书。即便我使用R语言快2年多了,但是读这本书还是受益颇多。
这一篇学习笔记对应第13章:使用magrittr进行管道操作。关于管道这个概念,我最早在Linux系统中接触,它是Unix系统设计哲学的体现,“组合小功能完成大任务”,比如说BWA比对后排序用管道的写法就是
bwa mem ref 1.fq 2.fq | samtools sort > align.bam
在R语言接触管道符号"%>%"是在学习dplyr
包时候,那个时候我以为这个符号是 Hadley Wickham 创造出来的,其实是来源于Stefan Milton Bache开发的magrittr
中。
基础部分
在没有管道符号之前,如果我要对一个变量做一系列的分析的话,那么写法是下面这个样子
# 先创建100个随机数
nums <- rnorm(100)
# 分成两列
nums_matrix <- matrix(nums, ncol = 2)
# 分别求两列的均值
nums_mean <- Matrix::colMeans(nums_matrix)
这里面我