更新预告:使用3个深度学习模型完成对Kaggle公开数据集"HR Analytics Case Study"的分类预测(目前文章更新中)。
本文旨在探讨深度学习模型简单运用到表格数据的学习上的可行性,使用数据集来至于kaggle。
总览
首先对数据集进行预处理,处理后分别使用MLP、1DCNN、TabNet模型来学习并预测,引入Accuracy、Precision、Recall、F1-Score来评估模型。最后结合模型的输出结果来简单分析影响员工离职的关键因数。
数据处理
数据说明
该数据集包含5个表共计29个变量、4410个样本,其中21个数字型变量,8个字符型变量,其中有两个表记录的是2015年全年的员工上下班打卡记录,节假日与周末除外。Attrition为预测变量。
数据预处理
无关变量去除
去除Over18、StandarHours、EmployeeCount、EmployeeNumber这些常量(固定值)
持续更新中......