1.研究背景
由于很多公司都需要数据分析,所以就想研究一下最近比较火热的岗位,希望通过本文的分析能够给广大求职者一个借鉴。
2.分析思路
(1)明确分析思路
想要了解数据分析类岗位招聘现状,可以从一下几个维度去进行现状下描述性分析:
招聘数据分析的公司有哪些特点?——公司基本信息
招聘薪酬待遇如何?——职位基本信息
招聘有什么要求?——职位要求信息
(2)搭建指标分析体系
针对以上分析维度问题搭建维度指标体系
3.数据采集
(1)采集工具
在八爪鱼采集器或者python爬虫。
(2)数据来源
采集拉勾网“数据分析”岗位,具体操作可从网络上学会。
4.数据清洗
(1)数据预处理
第一步 先备份数据,隐藏不需要的列,修改列名。
第二步 理解表中行列数据,观察数据有没有缺失值,有无错位,或者一些影响分析的脏数据,根据相关的观察并处理数据。
第三步 经过上一步的的简单清洗 ,心中应该有此数据元清洗加工的大致方向。
(2)数据清洗
a 处理重复值
在excel数据-删除重复值,检测到78条重复项,故删除。
b 处理缺失值
查看计算每列是否存在缺失值,如果一个字段数据确实超过40%,就要考虑删除重新获取数据或作其他措施。通过数据发现该数据并没有缺失值,所以无需处理。
c 处理异常值
公司所在地区是城市加地区,需将它们进行分析才能刚好地进行分析。利用分列功能将他们进行分列,并查看数据是否规范。
d 数据加工
观察到薪资列为文本数据,将其转换为数值型。通过观察数据,可以看到这列数据都有一个共同的特质,都是XXk-XXk。可以通过分列将数据分为最低工资和最高工资,替换k,就可以将数据变成数值了。
提取后的部分数据如图所示
5.数据可视化
(1)招聘公司分析
招聘数据分析的公司有什么特点呢?主要从招聘公司所在地区、公司规模,以及公司所属行业等维度指标来进行分析。
a 招聘的公司主要分布在那些城市?
从上述结果来看,北京是数据分析岗位占比最大的ÿ