关于如何爬取拉勾网上的招聘信息,网上教程很多,而且很详细,我自己不再重复提供了。
每个人遇到的大部分问题,我估计70%,在网上都可以找到答案。善于利用搜索引擎,自己多动手,就能够解决其中的大部分问题。
我感兴趣的是,如何处理爬下来的数据,这些数据能够描述什么样的现状。当然了,仅仅展示这些数据,对于数据分析来说是远远不够的。展示是第一步,是基础。如何从这些展示的数据中发现问题,并提出解决方法,甚至能够说服领导或者业务人员,按照你的方法去改进,才是对数据分析人员的挑战。
python相关职位的数据条数不多,大概500条左右。爬取下来的原始数据,格式如下:
分析工具:jupyter notebook,比较直观,界面友好。用到的库主要是pandas、matplotlib、jieba、wordcloud
jupyter上读取数据文件,并展示前5行的数据
一、不同城市对python工作岗位需求
北京、深圳、上海提供了市场上74%的工作岗位,侧面也反应了,为什么大家都往北深上跑,因为机会多啊。一线城市的工作机会多,但是一线城市的竞争压力也比较大。
二、工资分布的情况
工资主要集中在10000~23000之间,高于30000或低于10000都比较少。总体来说起薪不算低&#x