背景
大数据概念越来越火爆,很多学生开始学习大数据,社会人士也蠢蠢欲动准备转行,对这个新兴职业充满期待。在感性背后,我们来理性看待下目前的数据挖掘岗位需求,如果您确定要进入数据挖掘行业,您要学习哪些知识。本文主要探索的话题为:
数据挖掘岗位市场需求量
数据挖掘岗位诱惑力
数据挖掘岗位对求职者的要求
数据获取
数据源:通过爬虫的方式,从拉钩网爬取数据挖掘频道下前10页的招聘岗位,公司,职能要求等相关数据。
详细数据字段与内容预览为:
数据清洗
• 对薪水字段的清洗我们将薪水范围(如15k-20k)清洗成最低薪水,最高薪水,平均薪水三个特征。在清洗的过程中,我们发现存在着“K”分大小写的情况,因此,我们优先将字母统一转化成小写。
对公司简介的清洗公司简介一般由公司属于行业(如移动互联网,电子商务)加上公司发展阶段(如成熟型)构成。我们将公司简介字段清洗成行业+发展阶段。此外,我们还对学历和工作经验进行拆分
需求现状
• 说明,未进行时序动态爬取数据,对需求量的变化我们暂且不做描述分析。
• 样本容量:150
• 在经验方面,主要为1-5年,占82%。其中,3-5年工作经验