Data Frame一般被译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的。Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那么就是从1开始自增的Sequence来标识每一行。所以说数据框在R语言中可是个好东西,R中它是用的非常频繁也是非常有用的数据集合。
创建数据集
a1 <- c(1:3)
a2 <- c(‘a’,‘b’,‘v’)
dat <- data.frame(a1,a2)
dat
a1 a2
1 1 a
2 2 b
3 3 v
这样就定义了一个以a1、a2为两列的数据框,第一列是数值型,第二列是字符型。
当然了,后面会讲到,读取结构化数据文件的话,比如csv、空格或者逗号分隔的txt文件,我们可以直接用相应的read.csv或者是read.table直接读进来成为数据框。
访问元素
访问第一行:
dat[1,]
a1 a2
1 1 a
访问第一列
dat[,1]
[1] 1 2 3
或者是直接引用列名
dat$a1
[1] 1 2 3
前面讲过,可以直接用attach(dat)绑定dat,就不需要数据名前缀了,这里还是再复习一遍吧!