R中常用数据结构
一:矩阵函数 mymatrix
矩阵是二维的,格式需要统一,即每个模式都需要有相同模式,要么是数值型,要么是字符型,要么是逻辑型
mymatrix<-matrix(cells,nrow=2,ncol=2,byrow=TRUE, dimnames=list(rnames,cnames))
cells:矩阵的元素(矩阵包含的数据)
nrow:行维数(矩阵有几行)
ncol:列维数(矩阵有几列)
byrow:矩阵是按行填充(byrow=TRUE)还是按列填充(byrow=FALSE),如果不写这个参数就是默认情况,默认情况是按列填充(TRUE和false必须大写)
dimnames:各维度中名称标签列表(行名和列名,允许为空)
rnames:行名
cnames:列名
二:数组函数 array
R语言中的数组元素的类型是单一的,可以是数值型,逻辑型,字符型或复数型等
array(data = cells, dim = length(data), dimnames = NULL
data:数组的元素(数组里的数据)
dim:为数组的维数,是数值型向量
dimnames:各维度中名称标签列表(行名和列名,允许为空)
数组的维数:c(3,4,2)—有两个矩阵,每个矩阵都是三行乘以四列的
三:维数向量 dim
dim属性是数组中很重要的属性,也叫维数向量,当维数向量有两个值时代表为矩阵,有一个值时代表为一维数组
a[2,3,2] 数组的第二行第三列而且是第二个数组的值
b[2,1:3,2] 显示数组第二行;第1-3列;第二个数组中的元素
dim(xx)数组的维数
四:列表 list
列表是R语言中的对象,它包含不同类型的元素,比如 - 数字,字符串,向量和另一个列表等。一个列表还可以包含一个矩阵或一个函数作为它的元素。
list <- list(A=c(1:3),B=month.abb,C=matrix(c(-1,-2,-3,-4)))
A:列表第一个元素(任意)
B:列表第二个元素(任意)
C:列表第三个元素(任意)
…
五:数据框 data.frame
data.frame一般被翻译为数据框,感觉就像由行和列组成的表,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的
student<-data.frame(A=c(11,12,13),B=c(“Devin”,“Edward”,“Wenli”),C=c(“M”,“M”,“F”))
A:列表第一个元素(任意)
B:列表第二个元素(任意)
C:列表第三个元素(任意)
…
六:向量 c
向量(一维数据): 只能存放同一类型的数据
c(data1, data2, …), 访问的时候下标从1开始,向量里面只能存放相同类型的数据
x <- c(1,5,8,9,1,2,5)
六:因子 factors
因子在整个计算过程中不再作为数值, 而是作为一个符号
factor(x=character(), levels, labels=levels, exclude=NA, ordered=is.ordered(x), nmax=NA)
x: 一个数据向量, 它将被转换成为因子
levels: Levels就是factor中的所有元素的集合(没有重复)
labels: 用来指定水平(levels)的名字
exclude: 一个值向量, 表示从向量x里面剔除的水平值
ordered:是否有顺序(TRUE:有顺序)
nmax: 水平数目的上界