summary():对数据进行汇总统计,输出结果包含了多个统计量,比如最小值、最大值、中位数、均值、缺省值等。
- 如果data中有分类数据,直接用summary(),会得出如下结果:例如gender显示的是其数据对应的属性:长度、数据结构、存储类型
gender
Length:167
Class :character
Mode :character
- 那解决这个问题,就是把字符型改成因子型,具体做法和结果如下:
> data$gender<-as.factor(data$gender)
> summary(data)
gender
: 1 #1表示的是data中的第一个分类变量的汇总统计信息
Female:94
Male :73
当变量的计量类型为分类型或顺序型时,直接summary(data)无法得到统计频数等,需将其转换为因子(因子是R中的一种特殊的向量),有两种方法:
-
as.factor(向量名/data$变量名)
- 缺点:无法对应顺序型变量
-
factor(向量名/data$变量名,ordered=TRUE/FALSE)
- ordered为TRUE表示顺序型变量,为False表示分类型变量
文章内容是在学习R语言过程中的一些心得,目前还在学习阶段是个渣渣,欢迎各位大佬在评论区留言。