数据清洗
文章平均质量分 65
u010380670
这个作者很懒,什么都没留下…
展开
-
数据转换
衍生变量 data1 <- read.csv("数据转换数据.csv",na.strings = NA) #日期格式转换 data1$registration <- as.Date(paste(substr(data1$registration,1,4), substr(data1$registration,5,6...原创 2018-12-08 10:47:15 · 829 阅读 · 0 评论 -
哑变量处理
dummyVars(formula, data, sep = “.”, levelsOnly = FALSE, fullRank = FALSE, …) sep:因子变量名及其级别之间的可选分隔符。使用sep = NULL表示没有分隔符(即模型的正常行为)。 data4 <- read.csv("玩家玩牌数据.csv") head(data4) library(VIM) aggr(data...原创 2018-12-08 12:28:23 · 2945 阅读 · 0 评论 -
对缺失值赋值
查看数据缺失情况 questionnaire <- read.csv("问卷调研数据.csv",header = TRUE) dim(questionnaire)#查看行数和变量 library(VIM) aggr(questionnaire[,-1],prop=FALSE,numbers=TRUE)#不要序号,以绝对数显示,有标签 建立逻辑回归模型,对性别进行预测 for(i in 2...原创 2018-12-06 23:25:41 · 1035 阅读 · 0 评论