拉勾网杭州站的数据采集及可视化分析之分析报告篇

在经历了  爬虫  状语从句:  数据清洗  了以后,就可以建模啦〜

BI链接是  拉钩BI  。 


如上图就是整个BI的界面。 

以下为分析报告


1,学历的影响有多大?


上图是拉钩杭州站全站27617个岗位的学历及其岗位平均薪资分布情况。

由此可见,硕士及其以上学历,真的是决定了工作的下限。即便考虑到离群值/异常值,也还是比其他学历要高不少。

同时,本科/不限/大专,在下边缘,即下限方面,并,没有很大差异。上限方面,好吧,是有一定差异,不过大部分人应该都够不着......

(但是这中位数,太夸张了吧......我们都被广大的程序员同胞们的薪资被平均了)



将条件筛选为3年以内的工作年限,本科的中位数的上四分位数都回到了我预期的水平..哈哈哈(笑出了难过的眼泪)

不过也能说明,互联网行业,都是经验越丰富越吃香?  (说起来..好像没什么问题)


上图为工作年限及薪资变化水平. 可以看到,都有了很大的变化~~~

(当然了,因为硕士和博士要求的样本量稍微少点,可能会存在一些极端值.)


博士


总共也才13个岗位.... 岗位关键词围绕在 让人感觉非常屌的词语上面...

也都是上市公司在这方面更渴望一些.  可以理解.


福利也是非常好.    股票期权也赤果果地写进来了. (不过你把人工智能写进岗位福利真的好吗)


硕士


以上为硕士的筛选.    怎么还有0-4k的... 估计是要找实习生吧.   扫一眼岗位关键词,  工程师,算法.  应该是算法工程师会比较渴望一点?  同样是 上市公司 的需求量最大.   (不需要融资的公司毕竟是数量摆在那里)


岗位福利比较接地气了.   本身也就377个岗位,样本还是有点少.

不过五险一金还是大家公认的职位福利啊.    弹性工作这点让我蛮吃惊的.

同时,也有一些岗位能够提供期权,六险一金等.


本科生/大专/不限

因为并没有很大的差异,所以我把相关的结果放一块儿了.

这三个学历可以覆盖百分之95的岗位了.


从体量来讲,程序员目前依旧是市场上最热门的岗位.   

因为本身不需要融资及未融资本身就占绝大头.因此岗位需求公司的融资情况也是毫无疑问的.

在岗位关键词方面, 工程师(程序员)和 互联网运营 也是占大头.


这个划分标准是我主观臆断.   大部分果然是停留在我预估的4-8k之间.

不过从反复调整的划分标准来讲, 实际上10-15k之间的岗位数量比4-8k的还要多! 简直让我看傻了.

当然了,技术岗本身的薪水就比较高(相对门槛比较高).同时,很多公司哪怕不招人,也非要挂个岗位上去......




从这两张图来讲,可以看出,目前高端的职位还是需要经验的沉淀的. 

这点对互联网岗位来说尤为重要. 

本科生/专科生 也可以通过经验的累积得到增值(我这样安慰自己)

PS: 在这里,没有统计到的一个维度就是本科生里面也区分为985,211,一本,二本,三本.

杭州因为只有浙大是985,所以不像北上广那样可能对985/211高校毕业的就业者也特别的追求.

但是数据无法体现是否高端的岗位也是被高校毕业生垄断. 这点无法确认.



现在什么岗位最火,工资高?

这个问题,一拍脑袋,当然是程序员啦~

当然,从拉钩杭州站来评估整个杭州工作需求是不科学的啦~ 

拉勾网杭州站上大部分都是互联网公司. 好多传统企业都不会选择在拉钩网上招人.

只不过从工资分布的角度来讲,产品/技术/金融,的的确确是时下最为火热的岗位.



筛选到3年及其以下工作时间


我只想说,  高端的程序员真的是太可怕了....太任性了


技术岗位

那么,技术岗位到底什么比较火热??


去掉"工程师"和"开发"两个比较常见的关键字.

最热的居然是Java! 

说好的PHP是世界上最好的语言呢??

(这里只截图岗位名. 所以不代表一定就是所需技能.)

与此同时,前端开发也是非常强势.


如果按平均收入来进行WordCloud的话,很难得出一个薪资最高的.毕竟有好多极端值.

不过扫一眼,最中间的总监..(这不是个废话),还有几个知名大厂,等等都会出现.



筛选到3年以内经验, JAVA,前端,测试,传统的三大项,都是最热门的.

就行业标签/岗位标签而言,




以上是超过80个岗位的岗位关键词.

蚂蚁..金服...这种关键词的出现,我们要强烈的谴责..

同时,专业...技术...这种,我们也就忽略.

主要看    架构师/学习/算法/JAVA/Python/前端/c++ 的一些指标.

(这里结巴的分词模式我应该是选错了.  前端和前端开发居然都分开来了...)

不看了,再看就要流泪了.

(想要看得更细致,可以直接看我的BI链接)


运营岗位

运营岗位,相对而言,关键词不会太复杂.

去掉了 "运营" 这个关键词,可以看到最热门的依次是 "专员"、"客服"、"媒体".


“媒体”应该指的是新媒体。分词强行分开了。符合目前每家每户都要弄个公众号的特点


具体的一个分类而言,

新媒体运营/内容运营

产品运营/电商运营/用户运营,也是大家常见的运营分类。


岗位标签/行业标签。    

毕竟是杭州嘛,可以预想得到的是,肯定有个电商。





我要去医院啦。写了好几个小时了。

通过研究杭州站的数据,发现自己在技能上面,分析的逻辑上面,都还有很大的漏洞。

所以,希望把自己的小小作品,拿出来跟大家分享。

恰好也是我的一个好朋友面临找工作之际,我也希望我这边简单的文章能够帮助到他,也让他能够明白一个道理:



“如果下辈子投胎找工作,我一定要去当程序员!!!”









  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值