爬虫-拉勾数据分析

年后犹豫找工作到底应该去哪里,且想到之前盲目找工作遇到的各种坑爹问题,网上搜寻相关的信息进行抉择,结果无功而返,于是决定稍微花点时间对拉勾做一次数据分析。

爬取时间:2018/2/6 技术:Java

拉勾的数据爬取相对容易,主要针对了部分职位的数据获取,数据主要包含近一个月内的职位发布,为防止反爬,设定为单线程延迟1s,所以不到半小时获取3w数据进行分析,应该具有一定的参考意义。

编程语言岗位发布数量统计

前端仍然非常火热,目前明显是高于其他岗位的,且按照发展时间推算的话,找工作比移动端要容易些,不排除未来的人口大爆发。移动端经历寒冬,趋于稳定,Java长期发展已经非常稳定了,C#似乎有点...........

总体岗位地区分布图

IT行业,北京一览众山小....

Java岗位地区分布图

结合上图总体岗位分布,可以看出杭州Java的迅速发展,超越深圳,次于上海,阿里巴巴应该起到不小的带领作用!

Android岗位地区分布图

针对Android 岗位,北京仍然是遥遥领先其他城市,基本是其他大城市加起来的总和.....

公司岗位发布数量排名Top20:

公司岗位数量坐标
美团点评309北京
滴滴出行305北京
腾讯279深圳
百度259北京
武汉佰钧成技术有限公司212深圳
小米211北京
今日头条200北京
好未来149北京
爱奇艺129上海
美图公司119深圳
泛微113广州
搜狗112北京
京东商城111北京
江苏亿科达102上海
蚂蚁金服集团98杭州
瓜子二手车直卖网95北京
网易89杭州
Face++81北京
微创75廊坊
作业帮70北京

从结果看出:在招职位比较多的都是些大公司,且坐标多为北京,如果能够分散一些就好了,难道这是导致北京拥挤的原因吗?

薪资区间高频排行

绘图太耗时了,不如表格方便快速,由于爬取过程中忽略了年限要求的爬取,所以这次薪资统计的合并统计可能不太公正,所以我用该地区出现频率最高的薪资作为该地区参考标准,仅供参考!

坐标薪资出现频率
深圳15k-30k388
广州15k-25k307
北京20k-40k261
上海10k-15k221
杭州8k-16k94
宁波6k-12k88
肇庆5k-10k86
合肥6k-10k66
南宁8k-10k54
南京10k-18k53
贵阳6k-8k35
沈阳4k-6k33
苏州7k-10k25
天津3k-5k25
重庆7k-12k25
青岛9k-15k19
惠州5k-7k14
郑州5k-9k13
西安7k-9k8
厦门15k-26k4
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值