> patientID<-c(1,2,3,4)
> age<-c(25,34,28,52)
> diabetes<-c("Type1","Type2","Type1","Type1")
> status<-c("Poor","Improved","Excellent","Poor")
> patientdata<-data.frame(patientID,age,diabetes,status)
> patientdata
patientID age diabetes status
1 1 25 Type1 Poor
2 2 34 Type2 Improved
3 3 28 Type1 Excellent
4 4 52 Type1 Poor
5. 因子(Factors)
如你所见,变量可归结为名义型(nominal)、有序型(ordinal)或连续型(ontinuous)变量。名义型变量(nominal variables) 是没有顺序之分的类别变量。糖尿病类型 diabetes(Type1, Type2) 是名义变量的一例。即使在数据中 Type1 编码为 1 而 Type2 编码为 2,这也并不意味着二者是有序的。有序型变量(ordinal variables)表示一种顺序关系,而非数量关系。病情 status (poor, improved, excellent) 是有序型变量(ordinal variable) 的一个上佳示例。我们明白,病情为 poor(较差) 病人的状态不如 improved(病情好转) 的病人,但并不知道相差多少。连续型变量(continuous vari