拉勾网数据分析师职位分析

项目背景:

2019年9月份开始学习数据分析相关课程,目前学到不少知识,准备开始找工作。为此准备先从拉勾上了解数据分析岗位的情况,并且运用自己之前学到的知识来实践一下。

收集数据

利用“后羿采集器”抓取2019年11月15日拉勾网站内搜索“数据分析师”关键词下的1200条职位信息。通过这些职位信息的分析和建模来进一步了解这一职位。

数据包含以下几个字段:

1.城市
2. 职位名称
3. 公司名称
4. 公司所处行业
5. 公司规模
6. 学历要求
7. 薪酬
8. 经验
9. 福利
10.技能

明确分析目标

对于自己关心的这些问题,下面会从多维度(城市、工作年限、学历、领域、公司规模几个维度)进行分析,以下采用Tableau进行分析:

1、城市分布

在这里插入图片描述
在这里插入图片描述
首先是分析招聘职位的地区分布情况,结果显示排名前三位依次为北上深一线城市,其中北京职位需求遥遥领先。平均薪酬和需求正相关,需要越多的城市,平均薪酬越高。
在这里插入图片描述
上图结果显示北上广深杭成全部都是移动互联网行业需求最多,其次是金融,不过这些结果和我们的实际认知是一致的,不算稀奇。当然这里行业划分其实很不规范,比如北京需求量很高的移动互联网其中不乏金融,所以行业需求量仅限参考,给到一个大致择业方向。

在这里插入图片描述
我们可以从上门的结果看到各行业职位分布情况及简要工资情况,结果毫无疑问是移动互联网需求最多,金融行业次之,而平均工资最高的出现在房产家居,汽车行业次之。
在这里插入图片描述
从公司规模分布图可以看出,150-500人的中小型公司需求量是最大的,其次是500-2000人的大公司。
在这里插入图片描述
说到薪酬部分了,这部分也是大多数人关心的问题,这里用平均工资来显示,平均薪酬为16.75K/月,只有北上深提供了较高的平均薪资。
在这里插入图片描述
大部分公司都是要求3-5年工作经验的,其实是1-3年的,两者占比为77%,说明绝大多数公司都是需要有工作经验的人才,没有工作经验比较难过关。
在这里插入图片描述
从学历要求看出,本科要求是基本,要求为硕士的公司仅占3.83%。
在这里插入图片描述
需求最多的公司为不需要融资的,其次为上市公司,这些公司大部分资金充足,比较可靠。

词云展示

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import wordcloud
from wordcloud import STOPWORDS
import jieba
from scipy.misc import imread
import re
pd.set_option('display.max_columns', 20)
data=pd.read_excel('F:/tebleau文件/拉勾网数据.xlsx')
txt=''.join(i for i in data['福利'])
mask=imread('C:/Users/admin/Desktop/1.jpg')#插入背景图
w1=wordcloud.WordCloud(scale=4,font_path='迷你简少儿.ttf',background_color='white',mask=mask,width=1000,height=600)
#font_path为指定字体
w1.generate(" ".join(jieba.lcut(txt)))
plt.imshow(w1)
plt.show()

在这里插入图片描述
可以看出公司福利基本为:五险一金、周末双休、弹性工作。
在这里插入图片描述
所要求的技能:数据分析、Mysql、SPSS、BI等

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值