第三章将 selenium集成到scrapy中

最新推荐文章于 2024-05-31 21:24:28 发布

---Crossover---

最新推荐文章于 2024-05-31 21:24:28 发布

阅读量1.2k

点赞数

分类专栏：爬虫

本文链接：https://blog.csdn.net/shaququ/article/details/77587886

版权

1.这里是jobbole的spider中的代码

class JobboleSpider(scrapy.Spider):
    name = "jobbole"
    allowed_domains = ["python.jobbole.com"]
    start_urls = ['http://python.jobbole.com/all-posts/']

    # 自定义设置
    custom_settings = {
        "DOWNLOAD_DELAY": 2,
    }

    def __init__(self):
        # 通过selenium启动一个chrome浏览器
        # 将webdriver放到spider中可以达到更好的并发效果，也可以在爬虫结束时关闭 Chrome
        self.brower = webdriver.Chrome(executable_path=r"C:\scrapy\resource\chromedriver.exe")
        super(JobboleSpider, self).__init__()
        dispatcher.connect(self.close_brower, signals.spider_closed)
    
    def close_brower(self):
        # 当爬虫退出的时候关闭chrome
        print("spider_closed close_brower")
        self.brower.quit()

2.这里是middlewares.py中的代

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

---Crossover---

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
第三章将 selenium集成到scrapy中

1.这里是jobbole的spider中的代码class JobboleSpider(scrapy.Spider): name = "jobbole" allowed_domains = ["python.jobbole.com"] start_urls = ['http://python.jobbole.com/all-posts/'] # 自定义设置
复制链接

扫一扫