使用深度学习预测员工流失率

最新推荐文章于 2023-02-23 18:34:21 发布

VIP文章 IT技术精选文摘

最新推荐文章于 2023-02-23 18:34:21 发布

阅读量3.9k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GV7lZB0y87u7C/article/details/79722033

版权

墨西哥的员工流动率在全球排名第八，平均每年约17％的流失率 - 一些行业（如餐饮服务）的流失率高达50％。根据Catalyst的一项研究，平均而言，替换员工的成本约为员工年薪的50％至75％。考虑到月薪为2万比索的中级职位，替换这名员工的总费用约为14万比索。平均而言，替换员工需要大约50天的时间，由于生产力损失而产生的成本将持续增加。对于像everis这样的拥有超过2万名员工的大公司来说，考虑到15％的流失率和15,000比索的平均薪水，年营业额总成本将上升至至少2.7亿比索。

在本文中，我们提供了一个神经网络模型的详细信息，该模型能够识别具有高度人员流动风险的员工候选人，并以大约96％的准确率完成此任务。

方法论

我们使用了由IBM数据科学家创建的虚拟数据集“HR Employee Attrition and Performance”(https://community.watsonanalytics.com/wp-content/uploads/2015/03/WA_Fn-UseC_-HR-Employee-Attrition.xlsx)。它包含1,470行员工历史数据。

经过探索性数据分析我们确定了一些与员工流动率相关性最高的特征。这些是我们发现的最重要的特征：

年龄

与家的距离

加班情况

教育状况

婚姻状况

工作过的公司数量

总工作年限

月收入

这些特征用于训练模型以预测流失风险。该数据集已经包含一个称为“attrition”的功能，该功能表明该员工是否会离开该职位并需要更换。该特征是一种热点编码（将数据分解为训练和测试集后显示），并被用作神经网络预测的目标。以下是用于单热编码的辅助函数：

由于数据集的不平衡性（员工流动率约占总人口的16％，或1,470人中的237人），因此采用上采样技术来重复更换营业案例 - 所以数据中有1,233个离职的个案和1,233个没有离职的个案。

对数据集进行上采样可以避免模型学习每次预测“没有离职”的情况; 在这种情况下，通过这样做可以达到大约84％的精度（这个精度可以作为我们的基准）。

接下来，使用StandardScaler将数据归一化到-1到1的范围，以避免异常值以不成比例的方式影响预测。

class standard_scaler:

    def __init__(self, name):

        self.name = name # candidato o empleado

        self.scalers = {} # asignar cada scaler con el nombre de la columna (ej.'Age')

    def add_scaler(self, scaler, name):

        self.scalers[name] = scaler

# Initialize a standard_scaler class to hold all scalers for future reverse scaling

scalers_empleados = standard_scaler('empleados')

def scale_and_generate_scaler(data):

    standard_scaler = StandardScaler()

    scaled = standard_scaler.fit_transform(data.astype('int64').values.reshape(-1, 1))

    return scaled, standard_scaler

def scale_array(scaler, array):

    return scaler.transform([array])

最低0.47元/天解锁文章

IT技术精选文摘

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
2
评论
使用深度学习预测员工流失率

墨西哥的员工流动率在全球排名第八，平均每年约17％的流失率 - 一些行业（如餐饮服务）的流失率高达50％。根据Catalyst的一项研究，平均而言，替换员工的成本约为员工年薪的50％至75％。考虑到月薪为2万比索的中级职位，替换这名员工的总费用约为14万比索。平均而言，替换员工需要大约50天的时间，由于生产力损失而产生的成本将持续增加。对于像everis这样的拥有超过2万名员工的大公司来说
复制链接

扫一扫

IT技术精选文摘 CSDN认证博客专家 CSDN认证企业博客

码龄7年

15: 原创

-: 周排名

103万+: 总排名

48万+: 访问

: 等级

5414: 积分

408: 粉丝

291: 获赞

63: 评论

776: 收藏

私信

关注

热门文章

最新评论

数据权限就该这么实现（实践篇），yyds！
bigSheller: 数据权限最好的实现方式就是自动sql注入。行级别的权限控制采用动态注入查询条件，列级别的权限控制一种方式是通过动态修改sql如SELECT NULL AS important_data FROM a，将重要的数据保护，若是使用的select *查询无法修改sql来过滤列转而使用结果集过滤的方式。所有的实现代码可以参考github.com
Kafka 的 Topic 为什么要分区？「豌豆射手」告诉你！
qq_42099303: 说的很好
25 张图 | 深入浅出「偏向锁」
胡须棉花糖: 轻量级锁的hashcode 记录在拥有锁线程的线程栈内Lock Record中；重量级锁在文中有答案
动图图解！收到RST，就一定会断开TCP连接吗？
weixin_45155849: 豁然开朗呀，还有个问题想请假一下，如果客户端想和服务器建立连接，并且发送了syn报文，但客户端收到的ack不是自己期望收到的，此时客户端会直接丢掉还是发给服务器一个rst呢？
Redis 实现高并发下的库存扣减（高频面试）
稻草人X22: 同样内容的帖子我已经看到5篇了

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。