factor() 把向量编码成一个因子
factor(x,levels=sort(unique(x),na.last=TRUE),labels,exclude=NA,ordered=FALSE)
x
: 向量
levels
: 是水平,可以自行指定各水平的标签,不指定时用各离散值得对应字符串
exclude
: 参数用来指定要转换为缺失值(NA)的元素值集合,如果指定了 levels, 则 因子的第 i 个元素当它等于第 j 个时元素值取 “j”, 如果它的值没有出现在 levels 中,则对应因子元素值取 NA
orderd
: 取值为真值(TRUE)时,表示因子水平是有次序的(按编码次序);否则(缺省值) 是无次序的
is.factor() 检验对象是否为因子
as.factor() 把一个向量转换成一个因子
levels() 得到因子的水平
table() 统计各类数据的频数
tapply() 分组求值
tapply(X,INDEX,FUN=NULL, ...,simplify = TRUE)
X
:是一对象,通常是一向量
INDEX
:是与 X 有同样长度的因子
FUN
:是需要计算的函数
simplify
是逻辑变量,取为 TRUE(缺省) 和 FALSE
gl() 此函数方便产生因子
gl(n,k,length = n*k, labels = 1:n, ordered = FALSE)
n
:水平数
k
重复的次数
length
结果的长度
labels
是一个n维向量,表示因子水平
ordered
是逻辑变量,表示是否为有序因子,缺失值为 FALSE