Scrapy框架分析ajax爬取腾讯招聘网站所有有关python的招聘信息并保存到mongoDB数据库

最新推荐文章于 2021-11-24 00:57:40 发布

B .O .

最新推荐文章于 2021-11-24 00:57:40 发布

阅读量294

点赞数 1

文章标签： mongodb python ajax

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44996454/article/details/116561695

版权

本文介绍了如何利用Scrapy框架结合Ajax技术爬取腾讯招聘网站上的Python职位信息，并将数据存储到MongoDB数据库。通过分析网络请求，找到数据源URL，设置Scrapy的配置，包括日志等级、robots.txt协议、User-Agent及启用管道，最终成功抓取并存储了5页职位数据。

摘要由CSDN通过智能技术生成

本次爬取网站的链接：https://careers.tencent.com/
第一步：
在搜索框输入我们想要爬取职位的关键信息如python c/c++ 点击搜索

第二步：
来到相关职位信息的页面
在这里插入图片描述
第三步：
在页面任何地方点击右键，再点击检查然后点击network 会出现如下页面

点击刷新后如图

点击新出现内容的第二行进入如下页面

我们想要的数据就在Data里然后点击Headers找到我们需要的url如图
在这里插入图片描述
图片中Request URL对应的我们要找的url ,对这个url发送请求就能得到我们这个页面里的数据然后进行解析就可以了，我这次以爬取5页为例，你们若想爬取全站修改一下参数就可以了
Scrapy代码：

import scrapy
import json
import time
class QiushiSpider(scrapy.Spider):
    name =

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Scrapy框架分析ajax爬取腾讯招聘网站所有有关python的招聘信息并保存到mongoDB数据库

本次爬取网站的链接：https://careers.tencent.com/第一步：在搜索框输入我们想要爬取职位的关键信息如python c/c++ 点击搜索第二步：来到相关职位信息的页面第三步：在页面任何地方点击右键，再点击检查然后点击network 会出现如下页面点击刷新后如图点击新出现内容的第二行进入如下页面我们想要的数据就在Data里然后点击Headers找到我们需要的url如图图片中Request URL对应的我们要找的url ,对这个url发送请求就能得
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。