因子,也称为因子型变量
是R中用于对数据进行分类
并将其存储为级别的数据对象
它可以是一个类别的集合
也可以是一个有序项目的集合
因子型变量可以取得的所有值,被称为因子水平(levels)
因子创建
在R中,使用因子来表示名义变量或有序变量,其中factor()函数是一种定义因子的方法。它是将一个向量转换成因子,其使用格式为
factor(x = character(),levels,labels = levels,exclude = NA,ordered = is.ordered(x))
名称 | 取值及意义 |
---|---|
x | 数据向量,也就是被转换成因子的向量 |
levels | 可选向量,表示因子水平,当此参数缺省时,由x元素中的不同值来确定 |
labels | 可选向量,用来指定各水平的名称,缺省时,取levels的值 |
exclude | 从x中剔除的水平值,默认值为NA |
ordered | 逻辑变量,取值为TRUE时,表示因子水平是有次序的(按编码次序);否则(FALSE)是无次序的 |