数据分析案例-某公司员工数据信息可视化_数据分析 案例 员工管理(1)

然而,目前很多企业对于员工数据的利用还停留在传统的表格和报表形式,无法直观地呈现数据的特点和趋势。同时,由于数据来源的多样性,数据的准确性和完整性也难以保证。因此,需要一种更加有效的方法来整合、分析和利用员工数据。

数据可视化是一种将数据以图形、图像等形式呈现出来的方法,可以直观地展示数据的特点和趋势。通过数据可视化,企业可以更加清晰地了解员工情况,为人力资源决策提供有力的支持。同时,数据可视化还可以提高数据的透明度和可信度,加强管理层与员工之间的沟通和信任。

因此,本次实验旨在通过可视化工具和技术,分析和呈现公司员工数据信息。这种数据可视化对于公司管理和决策制定非常重要,可以帮助领导层更好地了解员工情况,优化流程,提高效率,和制定人力资源策略。

2.数据集介绍

该数据集来源于Kaggle,原始数据集中共有4653条,9个特征变量,各变量解释含义如下:

Education: 员工的教育资格,包括学位、机构和研究领域。

Joining Year: 每位员工加入公司的年份,表明他们的服务年限。

City: 每个员工所在或工作的地点或城市。

Payment Tier: 将员工分为不同的薪资等级。

Age: 每个员工的年龄,提供人口统计洞察。

Gender: 员工的性别认同,促进多样性分析。

Ever Benched: 表示员工是否曾经暂时没有分配过工作。

Experience in Current Domain: 员工在当前领域的经验年数。

Leave or Not: 目标栏。

3.技术工具

Python版本:3.9

代码编辑器:jupyter notebook

4.导入数据

首先导入数据可视化的第三方库,并加载数据集

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import warnings
warnings.filterwarnings('ignore')

df = pd.read_csv("Employee.csv")
df.head()

177fdca4190d45c88f47078dce91dab2.png

查看数据大小

bfc3fc5c16cc432aacc89c726eaaca3d.png

查看数据基本信息

ecb4db979bfc47d788dba20388dff676.png

查看数据描述性统计

0d21300189254f479b402b77c982475e.png

5e2c54a823fa475e9900d48787305e80.png

删除缺失值和重复值

41e67b11236f444bba88194f3a314f61.png

5.数据可视化

# 员工教育分析
plt.figure(figsize=(10, 6))
sns.countplot(data=df, x='Education', palette='Set2')
plt.title('Education of Employees')
plt.show()

51fe5cfd354e4b519cc60047842ac7a5.png

1971名员工拥有学士学位,说明大多数员工拥有学士学位。拥有硕士学位的员工637人,156名拥有博士学位的员工。

# 入职年限分布
sns.histplot(data=df, x='JoiningYear', bins=20, kde=True, color='skyblue')
plt.title('Distribution of Joining Years')
plt.show()

403eca213fb341d28b618ada622670eb.png

2017年是加入该公司的员工人数最多的一年,有662名新员工。紧随其后的是,2015年,有464名新员工加入公司。2013年,共有396名员工加入公司。新员工人数最少的一年是2018年,只有239名员工加入该公司。

# 员工城市分布
city_cnts = df['City'].value_counts()
px.pie(city_cnts, names=city_cnts.index, values=city_cnts.values, 
       title='Employees Distribution by City', color_discrete_sequence=px.colors.sequential.Sunset, 
       hole = 0.5)

34dd8c67dd124abda7e0c9f2941e730b.png

大多数员工(42.4%)来自班加罗尔,其次是29%来自浦那,28.7%来自新德里

# 员工年龄分布
plt.figure(figsize=(10, 6))
sns.histplot(data=df, x='Age', bins=20, kde=True, color='coral')
plt.title('Employee Ages Distribution')
plt.show()

765c3424a07b497c90ed2dfbe16c3522.png

数据集中员工的最低年龄为22岁。25%的员工年龄在27岁以下或等于27岁。50%的员工年龄在30岁以下或等于30岁。75%的员工年龄在35岁以下或等于35岁。数据集中记录的员工最大年龄为41岁。

# 性别分布
sns.countplot(data=df, x='Gender', palette='muted')
plt.title('Gender Distribution')
plt.show()

98223c0b58b94e5da27489de5b9be0ba.png

组织中男性员工比女性员工多。

# 当前领域的经验分布
plt.figure(figsize=(10, 6))
sns.histplot(data=df, x='ExperienceInCurrentDomain', bins=20, kde=True, color='limegreen')
plt.title('Distribution of Experience in Current Domain')
plt.show()

6b2487ef84a54e4487c152586552215b.png

大多数员工有2年工作经验(681名员工),其次是5年工作经验(470名员工)。随着工作年限的增加,员工人数逐渐减少。只有少数员工在当前领域拥有6年(8名员工)或7年(9名员工)的经验。

# 员工休假或未休假人数
sns.countplot(data=df, x='LeaveOrNot', palette='dark')
plt.title('Count of Employees Leave or Not')
plt.show()

2dfc45484ba840c9b56c4815949cb278.png

大多数员工都没有休假。

# 支付等级分布
paymentTier_cnts = df['PaymentTier'].value_counts()
px.pie(city_cnts, names=paymentTier_cnts.index, values=paymentTier_cnts.values,
        title='Payment Tier Distribution', color_discrete_sequence=px.colors.sequential.Jet, 
        hole = 0.5)

3435b64930294cf3a11b2c0e3ac75133.png

大多数员工(71.5%)处于第三支付层。20.6%的员工处于第二支付层,只有7.89%的员工处于第一支付层。

# 按性别划分的年龄分布
px.box(df, x='Gender', y='Age', color='Gender', title='Age Distribution by Gender' , 
       color_discrete_sequence=px.colors.sequential.deep_r)

34ec93cff2714581837c91785e7fb9ec.png

大多数男女员工的年龄在27到35岁之间。

# 按支付级别划分的当前领域经验
px.violin(df, x='PaymentTier', y='ExperienceInCurrentDomain', 
                title='Experience in Current Domain by Payment Tier', color = 'PaymentTier', 
                color_discrete_sequence=px.colors.sequential.RdBu_r )

a9fc7c09f9f64fa49d8a5daef156ce61.png

第一个支付级别的大多数员工的工作经验在1年到4年之间。第二支付等级的大多数员工的工作经验在2年到4年之间。大多数第三支付等级的员工的工作经验在1年到4年之间。

# 城市性别分布
plt.figure(figsize=(12, 6))
sns.countplot(data=df, x='City', hue='Gender', palette='Set3')
plt.title('Gender Distribution by City')
plt.show()
![](https://img-blog.csdnimg.cn/img_convert/9a8cb5f8c0ec69e6499adead0da6e95b.png)



最全的Linux教程,Linux从入门到精通

======================

1.  **linux从入门到精通(第2版)**

2.  **Linux系统移植**

3.  **Linux驱动开发入门与实战**

4.  **LINUX 系统移植 第2版**

5.  **Linux开源网络全栈详解 从DPDK到OpenFlow**



![华为18级工程师呕心沥血撰写3000页Linux学习笔记教程](https://img-blog.csdnimg.cn/img_convert/59742364bb1338737fe2d315a9e2ec54.png)



第一份《Linux从入门到精通》466页

====================

内容简介

====

本书是获得了很多读者好评的Linux经典畅销书**《Linux从入门到精通》的第2版**。本书第1版出版后曾经多次印刷,并被51CTO读书频道评为“最受读者喜爱的原创IT技术图书奖”。本书第﹖版以最新的Ubuntu 12.04为版本,循序渐进地向读者介绍了Linux 的基础应用、系统管理、网络应用、娱乐和办公、程序开发、服务器配置、系统安全等。本书附带1张光盘,内容为本书配套多媒体教学视频。另外,本书还为读者提供了大量的Linux学习资料和Ubuntu安装镜像文件,供读者免费下载。



![华为18级工程师呕心沥血撰写3000页Linux学习笔记教程](https://img-blog.csdnimg.cn/img_convert/9d4aefb6a92edea27b825e59aa1f2c54.png)



**本书适合广大Linux初中级用户、开源软件爱好者和大专院校的学生阅读,同时也非常适合准备从事Linux平台开发的各类人员。**

> 需要《Linux入门到精通》、《linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论




**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**[需要这份系统化的资料的朋友,可以点击这里获取!](https://bbs.csdn.net/topics/618542503)**

**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**
  • 14
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值