数据框
数据框是一种矩阵形式的数据,数据框各列中的数据可以是不同类型的数据。数据框每一列认为是一个变量,每一行是一个观测;看以看做是矩阵的推广。
数据框的生成函数:data.frame()
列入数据框列表的限制:
1:他的分量必须是向量 ---- 数值,字符,逻辑
-----因子
-----数值矩阵
-----列表
------其他数据框(实现了数据框的嵌套)
2:矩阵、列表和数据框提供许多变量
3:数值向量、逻辑值因子格式不变
------字符向量强制转换为因子
------长度一致的变量形式的向量
------函数一致的矩阵结构
列表虽然可以存放不同类型的数据。但是他各个分量并不能实现对齐,(这个在上一篇已经说过),而数据框弥补了这个缺陷
> x
[1] 1 1 1 2 3 3 3
> y
[1] "女" "男" "男" "女" "女" "女" "男"
> z
[1] 80 86 86 75 64 54 67
> (student<-data.frame(x,y,z))
x y z
1 1 女 80
2 1 男 86
3 1 男 86
4 2 女 75
5 3 女 64
6 3 女 54
7 3 男 67
可以将x,y,z的标题进行转化:
可以对行名进行修改:row.names()
> (student<-data.frame(class=x,sex=y,score=z))
class sex score
1 1 女 80
2 1 男 86
3 1 男 86
4 2 女 75
5 3 女 64
6 3 女 54
7 3 男 67
> row.names(student)<-c("曹操","王斌","刘备","刘松","王田","张飞","赵子龙")
> student
class sex score
曹操 1 女 80
王斌 1 男 86
刘备 1 男 86
刘松 2 女 75
王田 3 女 64
张飞 3 女 54
赵子龙 3 男 67
数据框的引用,数据框使用数组的形式去访问;-------看成是特殊的数组
返回y变量所有样本的观察数:
Student[,”student”]
> student[,"score"] #返回成绩表
[1] 80 86 86 75 64 54 67
> student[,3] #返回第三列(成绩)的信息 (和上面的效果一样)
[1] 80 86 86 75 64 54 67
> student[1:5,1:3]
class sex score
曹操 1 女 80
王斌 1 男 86
刘备 1 男 86
刘松 2 女 75
王田 3 女 64
> student[,3]
[1] 80 86 86 75 64