题目:员工离职预测训练赛
网址:http://www.pkbigdata.com/common/cmpt/员工离职预测训练赛_竞赛信息.html
要求:
数据主要包括影响员工离职的各种因素(工资、出差、工作环境满意度、工作投入度、是否加班、是否升职、工资提升比例等)以及员工是否已经离职的对应记录。
数据分为训练数据和测试数据,分别保存在pfm_train.csv和pfm_test.csv两个文件中。
其中训练数据主要包括1100条记录,31个字段。
测试数据主要包括350条记录,30个字段,跟训练数据的不同是测试数据并不包括员工是否已经离职的记录,学员需要通过由训练数据所建立的模型以及所给的测试数据,得出测试数据相应的员工是否已经离职的预测。
数据:https://pan.baidu.com/s/1qXZOS8W 密码:bxgm
代码:
data <- read.csv("E:/.../员工离职预测训练赛/数据/pfm_train.csv", sep=",", header=TRUE)
colnames(data)[1]<-c("Age") #首列列名乱码
###########################################################################################
########################## 逻辑回归 #############################################
####################################################################################