作为一个在找工作的人,最主要的必然是海投简历,但是作为一名数据人,能否用数据分析的思路帮助自己去更好、更快地找工作呢?
答案是肯定可以的,而且数据分析的思路不仅适用于找数据分析的工作,可以说,几乎找任何工作都可以用得到。(文末有彩蛋)
下面我就把自己的经历放上来,欢迎各位朋友一起交流(E-mail:rockyxin@rockyxin.com)
首先,收集数据
采集工具:“八爪鱼采集器”。
**采集时间:**2017年4月11日,21点。
采集方法:
- 打开智联招聘首页,选择全国区域
- 在搜索框中输入“数据分析”,回车进行搜索
- 将网址复制到八爪鱼采集器中,使用单机采集方式,自动跳转页码进行采集。
其他说明:此次采集内容包含公司名称、薪资、工作地点、公司性质、公司规模及经验、学历要求等内容,共有5460条信息。
然后,处理数据
使用八爪鱼采集器可以导出Excel、CSV等格式的文件,为方便后续其他操作,导出为CSV格式的文件。
主要将数据进行以下处理:
- 删除重复数据1426条,得到有效数据4034条。
- 对原数据的字段进行重编码,原始数据中字段均为拼音简称,将其改为汉字。如:将“gsmc”改为“公司名称”
- 根据岗位职责,填充空缺信息,如:岗位职责中明确写明要求本科学历,而“学历”字段中为空,则将空值改为本科。
- 拆分原字段“地点”,原数据中有诸如:北京-大兴区,这样的内容,为统一数据格式,将其分为两个字段:工作地点和具体地点,工作地点仅为市名,具体地点包含区名。
- 新增字段:省份,根据工作地点字段进行匹配省份名称,首都及直辖市均保持原来内容。增加薪资下限、薪资上限,分别表示薪资列中的最小值和最大值。
- 对薪资字段进行修改,原数据内容为“4001-6000”、“1000以下”、“面议”等,将区间分为“薪资下限”和“薪资上限”,面议的内容为空,1000以下,安装0-1000拆分。
- 增加经纬度字段,表示每个工作地点的经纬度。
- 修改经验列,将所有类似于1-3年,3-5年,取最小值。
最终得到:19个字段,4034条数据。
现在,开始分析
我比较感兴趣的是以下几个内容:
哪些公司在招聘?
哪些地方需求高?
招聘要求高不高?
薪资待遇好不好?
壹 / 哪些公司在招聘?
1、公司名称
在4000多条信息中,共有1764个公司