拉勾网招聘数据分析

本文通过爬虫从拉勾网获取数据挖掘岗位前10页的招聘信息,分析了岗位需求、经验要求、行业分布、学历需求、薪资水平等。主要发现数据挖掘岗位主要集中在移动互联网、金融、电商行业,需求均匀分布于不同发展阶段的公司,且本科及以上学历为主。经验与薪资正相关,起薪较高,工作3-5年的需求最大。
摘要由CSDN通过智能技术生成

背景

大数据概念越来越火爆,很多学生开始学习大数据,社会人士也蠢蠢欲动准备转行,对这个新兴职业充满期待。在感性背后,我们来理性看待下目前的数据挖掘岗位需求,如果您确定要进入数据挖掘行业,您要学习哪些知识。本文主要探索的话题为:

  1. 数据挖掘岗位市场需求量

  2. 数据挖掘岗位诱惑力

  3. 数据挖掘岗位对求职者的要求

数据获取

数据源:通过爬虫的方式,从拉钩网爬取数据挖掘频道下前10页的招聘岗位,公司,职能要求等相关数据。

详细数据字段与内容预览为:这里写图片描述

数据清洗

• 对薪水字段的清洗我们将薪水范围(如15k-20k)清洗成最低薪水,最高薪水,平均薪水三个特征。在清洗的过程中,我们发现存在着“K”分大小写的情况,因此,我们优先将字母统一转化成小写。

对公司简介的清洗公司简介一般由公司属于行业(如移动互联网,电子商务)加上公司发展阶段(如成熟型)构成。我们将公司简介字段清洗成行业+发展阶段。此外,我们还对学历和工作经验进行拆分

需求现状

• 说明,未进行时序动态爬取数据,对需求量的变化我们暂且不做描述分析。

• 样本容量:150

• 在经验方面,主要为1-5年,占82%。其中,3-5年工作经验

  • 6
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值