
数据清洗
文章平均质量分 65
u010380670
这个作者很懒,什么都没留下…
展开
-
数据转换
衍生变量data1 <- read.csv("数据转换数据.csv",na.strings = NA)#日期格式转换data1$registration <- as.Date(paste(substr(data1$registration,1,4), substr(data1$registration,5,6...原创 2018-12-08 10:47:15 · 872 阅读 · 0 评论 -
哑变量处理
dummyVars(formula, data, sep = “.”, levelsOnly = FALSE, fullRank = FALSE, …)sep:因子变量名及其级别之间的可选分隔符。使用sep = NULL表示没有分隔符(即模型的正常行为)。data4 <- read.csv("玩家玩牌数据.csv")head(data4)library(VIM)aggr(data...原创 2018-12-08 12:28:23 · 2978 阅读 · 0 评论 -
对缺失值赋值
查看数据缺失情况questionnaire <- read.csv("问卷调研数据.csv",header = TRUE)dim(questionnaire)#查看行数和变量library(VIM)aggr(questionnaire[,-1],prop=FALSE,numbers=TRUE)#不要序号,以绝对数显示,有标签建立逻辑回归模型,对性别进行预测for(i in 2...原创 2018-12-06 23:25:41 · 1049 阅读 · 0 评论