在大概了解了R语言和在自己电脑上安装了Rstudio之后,相信大家对学习使用R语言迫不及待了。接下来,我们会推出一系列的推文来帮助大家由浅入深的学习R语言,保证每一个同学在这系列推文结束的时候都能成为R语言编程的大牛。
温馨提示
本节内容难点较多,务必紧跟红色标记,牢记重点内容。
R语言作为一种编程语言,在生物信息和生物统计学中应用非常广泛。学习R语言的初期和学习其他编程语言一样,我们首先要了解在R语言中的各种数据类型及其用法。R语言中有许多存储数据的对象类型,包括了标量、向量、矩阵、数组、数据框和列表。这些数据结构之间的关系如图1所示。
图1:R中的数据结构
下面我们就从向量开始,逐一学习每种数据结构。
1. 向量(vector)
要求:掌握
向量是用于存储数值型、字符型或逻辑型数据的一维数组(通俗的来讲,就是“一串”东西)。
向量的创建执行组合功能的函数c()可用来创建向量,c是英文concatenate的缩写,代表连接的意思,可以将多个散在的元素合并成一个向量。如图2所示:
图2:向量的创建和数据类型
向量的类型向量的类型包括数值型、字符型和逻辑型等等,我们可以通过上图中的函数typeof()可以用来查看数据类型,这里,a是数值型向量,b是字符型向量,c是逻辑型向量。
向量的索引所谓“索引(index)”就是获取向量中的某一个元素的内容。具体怎么索引呢?我们在创建向量之后,通过在方括号中给定元素所在位置的数值就可以访问向量中的元素。如图3所示:
图3:向量元素的访问
(注意:R语言中向量的第一个元素所在位置是1,不是0,和其它编程语言不同!)
图3中a[2:4]等价于a[c(2,3,4)],这里冒号: