2024年Python拉勾网数据采集与可视化_拉勾网数据可视化

2401_84556564

于 2024-04-30 16:50:13 发布

阅读量799

点赞数 21

分类专栏：程序员文章标签： python 信息可视化开发语言

本文链接：https://blog.csdn.net/2401_84556564/article/details/138350774

版权

该篇文章主要讲述了使用Python爬虫技术从拉勾网抓取并分析Python相关职位信息，包括工作年限、学历要求、薪资等，通过数据可视化展示了热门岗位的分布情况。

摘要由CSDN通过智能技术生成

post的网址

url = ‘https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false&isSchoolJob=0’

反爬措施

header = {‘Host’: ‘www.lagou.com’,
‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36’,
‘Accept’: ‘application/json, text/javascript, /; q=0.01’,
‘Accept-Language’: ‘zh-CN,en-US;q=0.7,en;q=0.3’,
‘Accept-Encoding’: ‘gzip, deflate, br’,
‘Referer’: ‘https://www.lagou.com/jobs/list_Python?labelWords=&fromSearch=true&suginput=’,
‘Content-Type’: ‘application/x-www-form-urlencoded; charset=UTF-8’,
‘X-Requested-With’: ‘XMLHttpRequest’,
‘X-Anit-Forge-Token’: ‘None’,
‘X-Anit-Forge-Code’: ‘0’,
‘Content-Length’: ‘26’,
‘Cookie’: ‘user_trace_token=20171103191801-9206e24f-9ca2-40ab-95a3-23947c0b972a; _ga=GA1.2.545192972.1509707889; LGUID=20171103191805-a9838dac-c088-11e7-9704-5254005c3644; JSESSIONID=ABAAABAACDBABJB2EE720304E451B2CEFA1723CE83F19CC; _gat=1; LGSID=20171228225143-9edb51dd-ebde-11e7-b670-525400f775ce; PRE_UTM=; PRE_HOST=www.baidu.com; PRE_SITE=https%3A%2F%2Fwww.baidu.com%2Flink%3Furl%3DKkJPgBHA

最低0.47元/天解锁文章

2401_84556564

关注

21
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
2024年Python拉勾网数据采集与可视化_拉勾网数据可视化

不知道你们用的什么环境，我一般都是用的Python3.6环境和pycharm解释器，没有软件，或者没有资料，没人解答问题，都可以免费领取（包括今天的代码），过几天我还会做个视频教程出来，有需要也可以领取~给大家准备的学习资料包括但不限于：Python 环境、pycharm编辑器/永久激活/翻译插件python 零基础视频教程Python 界面开发实战教程Python 爬虫实战教程Python 数据分析实战教程python 游戏开发实战教程Python 电子书100本。
复制链接

扫一扫