一、因子
1.变量可分为名义型(没有顺序之分的类别变量),有序型(表示一种顺序关系而非数量关系),连续型(可以呈现某个范围内的任意值,并同时表示顺序和数量)
2.类别变量和有序类别变量在R中称为因子,函数factor()以一个整数向量的形式存储类别值,要表示有序型变量,需要为函数factor()指定参数ordered = TRUE,对于字符型向量,因子的水平默认依字母顺序创建,可以通过指定levels选项来覆盖默认顺序,保证指定的水平与数据中的真实值相匹配,任何在数据中出现而未在参数中列举的数据都将被设为缺失值。
在R中无法用//解释一行语句,str(patientdata)意思是显示对象的结构。
summary(patientdata) 表示显示对象的统计概要
summary()显示了连续型变量最小最大均值mean和各四分位数(1st Qu,median,3rd Qu,四分位数(Quartile)也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份&