python数据分析工资_Python数据分析帮你清晰的了解整理员工们的工作效率和整体满意度...

weixin_39675926

于 2020-11-25 01:05:17 发布

阅读量279

点赞数

文章标签： python数据分析工资

f690bcad-8079-4c3a-ae4b-11cc6390c74b

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

项目背景

2018年，被称为互联网的寒冬之年。无论大小公司，纷纷走上了裁员之路，还有一些比较惨的，直接关门大吉。2019年上半年，甲骨文裁掉大量35岁左右的程序员，谁也没想到，IT界退休年龄这么早！而内心OS：我的房贷还没还清。。。。

假设你是人力资源总监，你该向谁开刀呢？先回答一下下面的问题。

各部门有多少名员工？

员工总体流失率是多少？

员工平均薪资是多少？

员工平均工作年限是多少？

公司任职时间最久的3名员工是谁？

员工整体满意度如何？

030476d8d5e44fda990f71dfac1cc093

数据处理

importpandas as pd

data= pd.read_excel(r‘c:\Users\Administrator\Desktop\英雄联盟员工信息表.xlsx‘,index_col = u‘工号‘)#访问columns属性，查看列字段

data.columns#访问index属性，查看行标记

data.index#访问values属性，查看数据集

data.values

5410ade434d6431cbcaeb1daac6be770

#对元数据集增加一列奖金列，数额为薪资的20%

data[u‘奖金‘] = data[u‘薪资‘]*0.2data[u‘奖金‘].head()#loc方法，根据索引列访问数据集

idx = [‘lol-1‘,‘lol-2‘,‘lol-3‘,‘lol-7‘]

data.loc[idx]

183f7ce0bb814020aaf3ad527735a0e2

#对元数据集增加一列奖金列，数额为薪资的20%

data[u‘奖金‘] = data[u‘薪资‘]*0.2data[u‘奖金‘].head()#loc方法，根据索引列访问数据集

idx = [‘lol-1‘,‘lol-2‘,‘lol-3‘,‘lol-7‘]

data.loc[idx]

adb8d0a37ea8493f970beac3465a62ac

此时，我们在上述结果中发现：寒冰、盖伦是重复数据条，在数据分析过程中，一定要注意重复数据带来的影响，所以我们要进行去重操作。

#查看重复数据条（bool结果为True代表重复）

data.duplicated()#查看有多少条重复数据

data.duplicated().sum() #结果：2#查看重复数据

data[data.duplicated()]#删除重复数据条，inplace参数代表是否在元数据集进行删除，True表示是

data.drop_duplicates(inplace=True)#再次查看是否全部去重

data.duplicated().sum() #结果：0，说明数据已经唯一

f95a18169ee442ac977dbd8b7a07d699

数据分析

1.各部门有多少名员工？

#频数统计

data[u‘部门‘].value_counts()#ascending = True代表升序展示

data[u‘部门‘].value_counts(ascending = True)

db7caa329dc7496eb52492badc099e46

2.员工总体流失率是多少？

#频数统计

data[u‘状态‘].value_counts()#normalize = True 获得标准化计数结果

data[u‘状态‘].value_counts(normalize =True)#展示出员工总体流失率

rate = data[u‘状态‘].value_counts(normalize = True)[u‘离职‘]

rate

0f244b4c83b5472c90823f7b5d48f3ed

3.员工平均薪资是多少？

8b55c2db01a6458489c44a70abcc3ece

由上图的结果可以看出，平均薪资在16800元，你达到了吗？！允许你去哭一会o(╥﹏╥)o！

4.公司任职时间最久的3名员工是谁？

#describe方法也是常用的一种方法，而且结果更全面。

data[u‘工龄‘].describe()#通过降序排序、切片操作，找到待的最久的三名员工

data[u‘工龄‘].sort_values(ascending = False)[:3]

ID= data[u‘工龄‘].sort_values(ascending = False)[:3].index

data.loc[ID]

8591db9a3c784b8783696843a0d70a50

6.员工整体满意度如何？

data[u‘满意度‘].head()#通过查看满意度前五行发现，不太直观，我们可以用map进行映射，先建立一个映射字典

JobSatisfaction_cat ={1:‘非常满意‘,2:‘一般般吧‘,3:‘劳资不爽‘}

data[u‘满意度‘].map(JobSatisfaction_cat)#对元数据集进行满意度映射

data[u‘满意度‘] = data[u‘满意度‘].map(JobSatisfaction_cat)

data[u‘满意度‘].head()

1c78a857c174491fba95f4528e88a735

接下来，进行员工整体满意度分析。通过计算可以得出：70%员工都比较认可公司，但仍有30%员工对公司不满意。人力主管以及部门主管需要进一步探究清楚这30%员工的情况，因为不满意是否已经离职？还是存在隐患？是否处于核心岗位等等问题值得我们进一步探究。

data.head()#频数统计

data[u‘满意度‘].value_counts()#获得标准化计数结果，考虑到百分比更能说明满意度情况，所以乘100展示

100*data[u‘满意度‘].value_counts(normalize = True)

6bc4358d828d43f7bb30a02ec6d18cbe

原文地址：https://www.cnblogs.com/hhh188764/p/13207784.html

weixin_39675926

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python数据分析工资_Python数据分析帮你清晰的了解整理员工们的工作效率和整体满意度...

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。项目背景2018年，被称为互联网的寒冬之年。无论大小公司，纷纷走上了裁员之路，还有一些比较惨的，直接关门大吉。2019年上半年，甲骨文裁掉大量35岁左右的程序员，谁也没想到，IT界退休年龄这么早！而内心OS：我的房贷还没还清。。。。假设你是人力资源总监，你该向谁开刀呢？先回答一...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。