python爬取招聘网站源码及数据分析_如何用爬虫抓取招聘网站的职位并分析

最新推荐文章于 2024-06-18 16:26:09 发布

weixin_39683769

最新推荐文章于 2024-06-18 16:26:09 发布

阅读量2.7k

点赞数

文章标签： python爬取招聘网站源码及数据分析

最近有不少程序员又开始找工作了，为了了解目前技术类各职位的数量、薪资、招聘公司、岗位职责及要求，我爬取了拉勾网北上广深4个城市的招聘数据，共3w条。职位包括：人工智能(AI)、大数据、数据分析、后端(Java、C|C++、PHP、Python)、前端、Android、iOS、嵌入式和测试。下面我将分两部分进行介绍，第一部分是数据抓取；第二部分是数据分析。如需源代码在公众号(见文末)回复关键字职位即可。如遇到图片打不开的问题，可访问：https://juejin.im/post/5e83edfbf265da47d537ba74

数据抓取

这里我并不是通过传统的抓网页，解析HTML代码的方式爬取数据，而是用 Charles 软件抓取拉钩APP请求数据的接口实现。

大概的流程是启动Charles -> 手机连接Charles代理(二者需处于同一个局域网)-> 打开APP请求数据->观察Charles截的包，从中找到我们想要的接口

首先，找到搜索职位的接口

/v1/entry/positionsearch/searchPosition

这是一个 POST 请求，我们还要找到请求的 header 和 body，最关键的 header 和 body 如下

header：

'X-L-REQ-HEADER': '{"deviceType":150,"userType":0,"lgId":"11835BCC-8815-456A-A094-64FB2B9323EF_1585362240","reqVersion":73600,"appVersion":"7.36.0","userToken":"xxx"}'

'content-type': "application/json"

其中，userToken字段每个不一样，需要自己抓包确定

body

{"tagType": "", "isAd": "1", "showId": "", "district": "", "keywordSource": 0, "keyword": "数据开发

最低0.47元/天解锁文章

weixin_39683769

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
python爬取招聘网站源码及数据分析_如何用爬虫抓取招聘网站的职位并分析

最近有不少程序员又开始找工作了，为了了解目前技术类各职位的数量、薪资、招聘公司、岗位职责及要求，我爬取了拉勾网北上广深4个城市的招聘数据，共3w条。职位包括：人工智能(AI)、大数据、数据分析、后端(Java、C|C++、PHP、Python)、前端、Android、iOS、嵌入式和测试。下面我将分两部分进行介绍，第一部分是数据抓取；第二部分是数据分析。如需源代码在公众号(见文末)回复关键字职位...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。