拉勾数据岗位和热门编程语言现状分析

功能点

爬取数据
  • 所有公司数据,名称简写,城市,行业,职位数量,人数范围,标签,介绍,融资阶段,平均工资
  • github2016年度最受欢迎编程语言相应年数薪水,城市,学历要求,公司融资阶段,公司行业
  • 大数据行业五大岗位相应年数薪水,城市,学历要求,公司融资阶段,公司行业,岗位要求
编程语言分析
  • 编程语言在不同城市(top10)的需求量
  • 编程语言在不同行业(top10)的需求量
  • 编程语言在不同融资阶段的需求量
  • 编程语言相应工作年限薪水平均值
大数据岗位分析
  • 五个岗位的职位需求关键词词云
  • 五个岗位在不同城市(top10)的需求量
  • 五个岗位在不同行业(top10)的需求量
  • 五个岗位在不同融资阶段的需求量
  • 五个岗位相应工作年限薪水平均值
数据可视化
  • Bokeh
  • Echarts

开发工作

  • 编写数据采集所用语言:python
  • 针对拉勾网反爬虫的应对措施:

    • 加http头伪装成浏览器;
    • 找临界值更换IP;
    • 限制爬取频率;
    • 设置代理池。
  • 使用多线程爬虫:提高效率
  • 制作词云:jieba中文分词,自定义词典,wordcloud生成图片
  • 分析结果可视化:bokeh,echarts

数据岗位分析结果

  • 数据岗位不同城市需求增长趋势
    2016.02数据
    图片描述
    2017.05数据
    图片描述
    可以看到TOP5城市依然未变,南京武汉的数据岗位增加明显,数量上而言,总体翻倍
  • 数据分析岗位增长趋势
    数据分析相关专业作为新兴行业在近一年来的发展势头迅猛,2016年10月之前的招聘信息十分稀少,但在短短四个月的时间内增长至一千多个。(2016.10-2017.1)
    2017.02数据
    图片描述
    2017.05数据
    图片描述
  • 数据岗位工资水平两年内变化
    2015年数据岗位相应工作年限平均工资
    图片描述
    2017.05数据岗位相应工作年限平均工资数据

    可以看出,两年内数据岗位的工资明显提高,起薪近乎涨了一倍,各个年限增长趋势也很明显。

  • 数据挖掘工资趋势
    2015.12数据
    图片描述
    2017.05数据
    图片描述
    总体都比两年前对应年薪高,并且高薪比例明显提高
  • 数据岗位和普通开发不同年限工资对比
    普通开发岗位工资水平
    图片描述
    数据岗位工资水平
    图片描述
    3-5年和5-10年的工资水平没有明显增长,也许说明重复的劳动不能代表技术的增长
  • 数据岗位和普通开发岗位要求学历对比
    图片描述
    图片描述
    可以看出,数据岗位对学历的要求较普通开发高,硕士的比例增加,并出现了博士的需求。
  • 词云结果实例
    数据架构师岗位要求词云
    图片描述
    可以看出对架构师而言,“开发”还是最重要的,“架构设计”毫无疑问成为关键词,另外管理能力也有所要求
    数据分析师岗位要求词云
    图片描述
    可以看到数据分析师也需要掌握数据挖掘的技能。另外数学成为了一个关键词,编程语言主要是“SQL”,“SAS”等,运营也出现在词云中说明数据分析师也需要有运营能力。
    数据挖掘岗位要求词云
    图片描述
    可以看到算法成为了一大关键词,说明数据挖掘对算法的要求还是挺高的,另外“计算机”和“数学”成为了需求最多的两个专业,编程语言方面“SQL”,“ JAVA”,“ R”都有要求。
    数据可视化岗位要求词云
    图片描述
    可以看到前端成为了一个关键词,另外可视化相应的工具如“ECHARTS”等也出现在词云中,交互和开发同时出现,这在其他岗位是没有的,说明可视化还是需要视觉效果

2016github10大热门编程语言现状分析

  • 职位需求量

图片描述

  • 所在行业

Python岗位所在行业
图片描述
scala岗位所在公司行业
图片描述
可以看出Python的应用更广,而Scala主要是数据服务行业需要。原因是Python除了可以用来做web开发,在科学计算等方面的表现也很出色。

  • 岗位城市分布(示例java)
    Java岗位城市分布
    图片描述
    可以看出Java的总体需求还是北上广深杭比较多,而杭州数量多的可能也许是因为坐落在此的阿里巴巴内部使用Java较多
  • 岗位所在公司融资阶段(示例PHP)
    图片描述
    对PHP需求最多的是初创型公司,可能因为PHP可以做到快速开发并且在中小规模公司比较适用。

多维度分析

普通开发不同城市不同工作年限平均工资
图片描述
可以看出,北京的整体工资水平最高,高薪主要集中在北上广深杭,其中,杭州的工资水平也较高,可能因为杭州是阿里巴巴网易等大型互联网公司总部所在地。

不同融资阶段公司工作年限不同平均工资
图片描述
可以看到1-3年和3-5年工资差距并不明显,D轮及以上公司给的工资整体水平都比其他融资阶段高

分析结论

  • 数据岗位集中在北上广深,需求量呈爆炸式增长。
  • 数据岗位算法、学历要求更高,对业务敏锐,薪资更高。
  • 门槛高的岗位需求量更少(Scala), 门槛低应用广(Python)
  • 互联网行业对人才的要求越来越高(算法、数学、业务)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值