python selenium 爬取网页审查元素_Python 爬虫 | selenium爬取某招聘平台

本文介绍了作者参加爬虫比赛时,利用Python的selenium库爬取某招聘平台大数据工程师职位信息的过程。通过分析网页,发现数据请求未加密但涉及cookie混淆,故采用selenium获取cookie来解决。爬取数据包括工资、经验、地区、学历和行业,存储到MongoDB中。后续将更新关于如何逆向cookie生成逻辑的内容。
摘要由CSDN通过智能技术生成

最近小编参加了学校的爬虫比赛,由于我是比赛开始后一天我才知道有这个比赛,这个比赛不止需要做爬数据,还需要做数据分析,因此时间比较紧。

本次比赛的主题是围绕着大数据工程师进行数据的爬取和分析。

本次的受害者

aHR0cHMlM2ElMmYlMmZ3d3cubGFnb3UuY29tL2pvYnMvbGlzdF8lRTUlQTQlQTclRTYlOTUlQjAlRTYlOEQlQUU/bGFiZWxXb3Jkcz0mZnJvbVNlYXJjaD10cnVlJnN1Z2lucHV0PQ==

目录:

1、环境

2、分析网站

3、实现爬取

1、环境

Python3.7、requests、selenium

2、分析网站

先打开开发者工具,再在搜索栏中输入大数据

4d4d60dc8debb915260e6b3587a5d714.png
图1

a48629c72bf8efc05d4899466fefd522.png
图2

筛选XHR请求很容易就

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值