Scrapy返回空列表问题的解决办法

KKK3号

已于 2023-04-02 19:10:44 修改

阅读量618

点赞数 1

分类专栏：学习笔记文章标签： scrapy python 开发语言

于 2023-04-02 18:59:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61151031/article/details/129915140

版权

学习笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

今天学习Scrapy框架时，调用下面的方法发送请求时返回的居然是一个空列表。

import scrapy


class Test01Spider(scrapy.Spider):
    name = "test01"
    allowed_domains = ["https://baike.baidu.com/item/%E7%99%BE%E5%BA%A6/6699?fromModule=lemma_search-box"]
    start_urls = ["https://baike.baidu.com/item/%E7%99%BE%E5%BA%A6/6699?fromModule=lemma_search-box"]


    def parse(self, response):
        pass
        get_text = response.xpath("/html/body/div[3]/div[2]/div/div[1]/div[4]/div[3]/text()").extract()
        print(get_text)

在我尝试很多遍，并且检查发现xpath没错的情况下还是返回空列表。

后面上网搜了很多解决方案，发现是头信息里的cookie没有设置，Scrapy默认用了它内部设置的头信息。于是对setting里面的内容进行修改就可以了：

1、取消注释COOKIES_ENABLE = False：

2、取消注释DEFAULT_REQUEST_HEADERS并且增加Cookie信息：

这样再请求就可以获取到相应的信息了：

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

KKK3号 CSDN认证博客专家 CSDN认证企业博客

码龄3年

95: 原创

30万+: 周排名

12万+: 总排名

19万+: 访问

: 等级

1322: 积分

250: 粉丝

342: 获赞

30: 评论

1721: 收藏

私信

关注

热门文章

分类专栏

QT 4篇
机器学习 1篇
Pytorch 2篇
计算机网络 3篇
Android App开发 3篇
MATLAB 3篇
数据结构和算法 16篇
嵌入式开发 14篇
C++ 18篇
学习笔记 6篇
深度学习 2篇
Linux 5篇
Python 12篇
C语言 4篇

最新评论

【MCS-51】定时器原理
做而论道_CS: 定时器的原理？定时器，本质上是 N 位的二进制递增计数器。　它可以对外来的脉冲计数，　也可以对系统中的机器周期计数。由于机器周期的时间是固定值。　对机器周期计数时，数字，也就代表了时间。　这时的计数操作，就称为定时。从初始值，递增到最大值之后，再计一个数，　计数器就会出现一个进位（也称为溢出），　同时，计数值回到全零。以后，计数器将从零开始继续计数。这才是定时器的原理。
数字式温度计的设计
2301_79020626: multisim怎么搞，这些芯片都没有
数字式温度计的设计
KKK3号: Proteus哦
数字式温度计的设计
zz爱吃鸡腿腿: 博主，这个是什么仿真软件，
数字式温度计的设计
KKK3号: 这个是数字电路，没有代码诶

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。