分析背景
前几天用爬虫爬了一下拉勾网-北京-数据分析岗位的数据,目的是想了解下北京互联网招聘市场对于数据分析岗位需求现状。
主要回答的问题有三个:一是什么样的公司在招聘数据分析?二是招聘条件和要求如何?三是这些公司都在哪?
数据来源是拉勾网,2018年8月6日爬取。之所以选择拉勾网,是根据之前的从业经验决定的。一般公司招聘都会同时开启N个招聘渠道,而拉勾网的定位是专业的互联网招聘平台,是大部分互联网公司招聘的主要渠道;非互联网企业则多数选择像智联、BOSS等平台,很少会再同时使用拉勾网作为另一招聘渠道。如果想了解互联网行业的需求状况,使用拉钩上的数据进行分析能得到相对纯粹的分析结果。
使用的工具是Excel
1.什么样的公司在招聘数据分析?
在分析这个问题的时候使用了公司类别及公司规模字段,初步分析时发现了两个占据很大比例的类别实际意义很弱,一个是‘移动互联网’,另一个是‘O2O’。相对比于其他的如‘电子商务’、‘生活服务’等业务类别,这两个概念属于他们的上层概念,有点过于宽泛。
所以在接下来的分析中做了拆分和删除处理:如果只有‘移动互联网’或‘O2O’类别的公司,这两个类别予以保留;如果还有其他的类别描述,则删除过于宽泛的‘移动互联网’和‘O2O’,采用剩下的类别。