一、分析目的:
1、了解主要是哪些城市对数据分析师的需求较大;
2、明确各行业对数据分析师的需求;
3、了解数据分析师的基本学历门槛及工作经验要求;
4、了解数据分析师薪资情况。
二、数据采集:
数据来源:利用八爪鱼采集器在招聘网(前程无忧,拉勾网,boss直聘网)上爬取数据分析岗位的招聘信息,爬取字段包括公司名称、工作地点、公司领域、公司规模、职位名称、薪水、工作经验、学历要求、薪资情况;共爬取了3700多条记录。
主要工具使用:八爪鱼采集器、Excel表格、Tableua
三、数据清洗:
1、虽然爬取的数据大部分是数据分析岗位,但同时也包含了部分人力资源与销售的岗位,所以下面提取出数据分析岗位的记录:
通过函数公式find、if跟数组进行判断筛选 =IF(COUNT(FIND({"数据分析","数据运营","分析"},A2)),"1","0")
2、去重:利用Excel的去重用具对相同的记录进行删除:
3、转换:由于爬取的记录中公司具体信息跟招聘要求等多项信息都混在同一列中,可通过分隔符进行分列转化:
招聘要求中的学历,经验等,也可分隔符的方法进行分列转化。
4、提取:部分网站的招聘要求中,并没有相关的分隔符隔开,如下图,可以通过一些函数公式确定相关字眼的位置,从而进行提取:
5、去缺失值:完成对需要分析的字段转换与提取后,对部分记录存在缺失值的进行删除。
经过以上的数据清洗、转换等处理,剩余3000条有效记录。
四、数据分析
1、城市需求分析:
上图直观地表现出,在一线城市上海、北京、深圳、广州,数据分析岗位的需求量较大,就业机会较高。另外杭州、武汉、成都、南京的需求量处于第二阶梯。
2、公司规模分布:
公司规模在150-499人的公司数据分析师的需求量最大,除了企业规模少于50人跟10000人以上的公司对数据分析师的需求较少之外,其他阶段的需求量都基本相差不多。因此,数据分析岗位受公司规模影响不大。
3、行业需求情况:
电子商务/互联网行业的需求量是最大的,在当今社会,电子商务/互联网的数据量越来月大,更新越来越快,其次是计算机、金融和服装行业、教育、游戏等,从上图可以看出,数据分析岗位涉及到的行业比较广泛,随着大数据的发展,各个行业对数据分析均有一定的需求。
4、对工作经验需求:
数据分析岗位从招聘信息上看,对从业人员的经验要求并不是特别的高,总体上对经验在1-4年的需求占大部分。8-9年或10年以上的需求会比较少。
5、对学历的要求:
爬取的数据中,有16%的公司没有设定学历要求,由于这一部分的参考价值不大,因此上面的分析中不对这部分数据进行分析。上面的圆饼图充分展示了数据分析岗位对本科的需求量最大,其次是大专,本科的需求量已经超过了大专需求量的2倍。可见数据分析岗位的基本学历门槛为本科。
6、薪资情况:
(1)薪资与城市的关系:
由于爬取的数据中,部分城市的招聘记录只有几条,在这种情况下,这几条记录无法代表该城市的薪酬情况,因此只对城市招聘记录超过30条的城市做薪资的分析:
上图,工资最高的在北京,北京平均薪酬的中位数也是最高的,为17.5K/月,其次为上海,深圳,杭州;大城市的薪酬分散情况比小城市大,主要是因为大城市行业种类也比小城市多,所以薪酬高能达到很高,低也有比小城市的还低,如果想要在数据分析岗位上长期发展,建议留在大城市。
(2)薪资与工作经验的关系:
随着经验的积累,数据分析岗位的平均薪资会越来越高,5-7年的平均薪资中位数在20k/月左右,也有高达65k/月的情况存在;8-9年的数据主要是由于记录比较少,所以数据不是很有代表性。
(3)薪资与学历的关系:
从各学历的平均薪资中位数来看高中跟大专相差不大,但大专跟本科的中位数相差了5K/月,而硕士跟本科的中位数只相差2.5k/月,由此可见,本科是数据分析岗位的主要门槛。
五、总结:
1、大城市对数据分析岗位的需求较大,其中上海、北京、深圳、广州需求量较大,就业机会较多;
2、电子商务行业、互联网、金融、服装、计算机是数据分析师首选的几大行业;
3、除了小规模的企业对数据分析师的需求量不大之外,企业规模在150-499人的企业对数据分析师的需求最高;
4、数据分析师的基本门槛是本科,大专是第二大需求;
5、3-4年的数据分析经验是现在各大行业最欢迎的,相对薪资也不低,薪资最高的是拥有5-7年工作经验;