第2章 创建数据集
1. 数据基本概念
- 行/实例标识符
日期型变量
连续性变量
名义型变量
有序性变量 - 对象类型:标量、向量、矩阵、数组、数据框、列表。
- 标量:只含一个元素的向量
1. 向量
- 向量:
a <- c(1, 2, 5, 3, 6, -1, 4)
数值型向量
b <- c('one', 'two', 'three')
字符型向量
c <- c(TRUE, TRUE, FALSE, TRUE)
逻辑型向量
同一向量中无法混杂不同模式的数据 - R语言计数从1开始,Python计数从0开始
- 访问向量中指定元素:
a[2]
a[c(2,4)]
c[2:5]
2. 矩阵
- 相同模式元素构成的二维数组
- 通过
matrix()
创建矩阵
y <- matrix(1:20, nrow=5, ncol=4)
x <- matrix(cells, nrow=2, ncol=2, byrow=TRUE,
dimnames=list(rnames, cnames))
矩阵默认按列填充
- 访问矩阵中的指定元素:
y[2, ]