实例标识符:
R语言中实例标识符case indentifier可以用rowname进行指定:
patientdata <- data.frame(patientID, age, diabetes,
status, row.names=patientID)
因子:
变量可归结为名义型、有序型或连续型变量。
类别(名义型)变量和有序类别(有序型)变量在R中称为因子(factor)。
函数factor()以一个整数向量的形式储存类别值,整数的取值范围是[1...k](其中k是名义变量中唯一值的个数),同时一个由字符串(原始值)组成的内部向量将映射到这些整数上。
名义型变量转化factor()
diabetes <- c("Type1", "Type2", "Type1", "Type1")
diabetes <- factor(diabetes)
#将此向量储存为(1,2,1,1)&#x