Scrapy框架分析ajax爬取腾讯招聘网站所有有关python的招聘信息并保存到mongoDB数据库

本文介绍了如何利用Scrapy框架结合Ajax技术爬取腾讯招聘网站上的Python职位信息,并将数据存储到MongoDB数据库。通过分析网络请求,找到数据源URL,设置Scrapy的配置,包括日志等级、robots.txt协议、User-Agent及启用管道,最终成功抓取并存储了5页职位数据。
摘要由CSDN通过智能技术生成

本次爬取网站的链接:https://careers.tencent.com/
第一步:
在搜索框输入我们想要爬取职位的关键信息 如python c/c++ 点击搜索

第二步:
来到相关职位信息的页面
在这里插入图片描述
第三步:
在页面任何地方点击右键,再点击检查 然后点击network 会出现如下页面
在这里插入图片描述
点击刷新后 如图
在这里插入图片描述
点击新出现内容的第二行 进入如下页面
在这里插入图片描述
我们想要的数据就在Data里 然后点击Headers找到我们需要的url如图
在这里插入图片描述
图片中Request URL对应的我们要找的url ,对这个url发送请求就能得到我们这个页面里的数据然后进行解析就可以了,我这次以爬取5页为例,你们若想爬取全站修改一下参数就可以了
Scrapy代码:

import scrapy
import json
import time
class QiushiSpider(scrapy.Spider):
    name = 
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值