1、数据的概念
数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量。
2、数据结构
R拥有许多用于储存数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表。
3、向量
向量是用于存储数值型、字符型或逻辑型数据的一维数组。
数组里面的数据要求是同一类型或模式。
标量是只有一个元素的向量,例如:f <- 3。用于保存常量。
a[c(2,4)]表示访问a中的第二个和第四个元素。R中的元素是从1开始的,Python中的元素是从零开始的。
c(2:6)等价于c(2、3、4、5、6),冒号表示一个区间的元素。
3、矩阵
矩阵是一个二维数组,每个元素都拥有相同的模式。
用函数matrix()来创建矩阵,一般的格式为:
mymatrix<-matrix ( vector, nrom=number_of_rows, ncol=number_of_columns, byrow=logical_value, dimnames=list(char_vector_rownames, char_vector_colnames))
- vector包含了矩阵的元素
- nrow和ncol用来表示矩阵的行数和列数
- byrow表示矩阵的填充方式,(byrow=TRUE表示按行填充,byrow=FALSE表示按列填充)一般默认情况是按列填充。
- di