2.2.4 数据框(data.frame())
由于不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较矩阵来说更为容易。数据框将是你在R中最常处理的数据结构,基本上大多数的时候用的都是数据框结构。
像2.1节中的病例数据表,包含了数值型和字符型数据。由于数据有多种模式,无法将此数据集中放入一个矩阵。在这种情况下,使用数据框是最佳的选择。
数据框可以通过函数data.frame()创建:
mydata <- data.frame(col1,col2,col3,......)
其中的列向量col1,col2,col3等,可以为任何类型(字符型、数值型、逻辑型)每一列的名称可以由函数names指定。
如下代码所示:
❶> patientID <- c (1,2,3,4)
❷> age <- c (25,34,28,52)
❸> diabetes <- c ("Type1","Type2","Type1","Type1")
❹> status <- c ("Poor","Improved","Excellent","Poor")
❺> patientdata <- data.frame(patientID,age,diabetes,status)
> patientdata
patientID age diabetes status
1 1 25 Type1 Poor
2 2 34 Type2 Improved
3 3 28 Type1