数据分析——Glassdoor上各公司员工的评价分析

(参考:小象学院公开课,网络文献)
1、分析目的:通过对美国各科技公司员工的匿名评价,分析员工满意度;
2、数据来源:Glassdoor网站(类似于国内的看准等);
3、数据大小:37576kb,共67k条数据;
4、使用的分析工具:jupyter notebook
5、使用到的python库:pandas、matplotlib、seaborn、wordcloud
6、分析思路:先通过pandas获取数据后,对数据进行预览;然后对数据进行预处理——如格式转换,去空值等;再通过对数值数据进行处理,绘制图表;最后对于文本数据进行拼接,绘制词云。

一、数据的载入与预览
首先载入相关的库,读取数据:

import pandas as pd
data_file = './dataset/employee_reviews.csv'
data_df = pd.read_csv(data_file)

对数据进行一个整体的概览:

data_df.head()

在这里插入图片描述
看到数据导入成功了,接下来看一下整体的数据情况:

data_df.info()

在这里插入图片描述
可以看到此样本数据共用67529行,16列,其中overall-ratings和helpful-count为数值数据,其他含字符串数据。但是从刚刚的数据预览可以看出从overall-ratings至helpfu-count中间7列应全为数值数据,所以说明中间那5列有干扰数据,需进行处理。

二、数据的预处理
首先,先把文本数据和数值数据进行区分

numeric_data = ['overall-ratings', 'work-balance-stars', 'culture-values-stars', 'carrer-opportunities-stars', 'comp-benefit-stars', 'senior-mangemnet-stars', 'helpful-count']
str_data = ['company', 'location', 'dates
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值