数据结构分为:标量、向量、矩阵、数组、数据框、列表
数据分析时,常用的是data.frame( )和c( ),即数据框和向量
1、标量:只含有一个元素,用来保存常量,如:
a <- 2
2、 向量:储存数值型、字符型、逻辑型数据,函数c( ),如:
a <- c(1,2,3)
同一向量中不能存储不同模式的数据。
3、矩阵:二维数组,每个元素都是相同的模式(数值型、字符型、逻辑型),函数matrix( ),
matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE,
dimnames = NULL)
如创建一个5*4矩阵:
> a <- matrix(1:20,nrow = 5,ncol = 4)
> a
[,1] [,2] [,3] [,4]
[1,] 1 6 11 16
[2,] 2 7 12 17
[3,] 3 8 13 18
[4,] 4 9 14 19
[5,] 5 10 15 20
- 1:20指的是把数字1到20填到矩阵里
- nrow指的是行数
- ncol指的是列数
- byrow指的是自动按行填充:true是按行填充,false是按列填充,不填是默认按列填充。
- dimnames指的是矩阵的“横标目”“纵标目”:如dimnames=list(rownames,colnames)
- (这种有点像excel)
4、数组:维度可以大于2的矩阵,普通应用R软件的一般应该用不到
5、数据框:包含数值型、字符型、逻辑型,可同时存储不同模式(数值型、字符型、逻辑型),函数data.frame( ),最好用的一种数据结构。
a <- data.frame(col1,col2,col3)
6、列表:整合若干对象,例如,某个列表中可能是若干向量、矩阵、数据框、其他列表等。函数list( )。