scrapy中使用正确的xpath出现空列表问题

最新推荐文章于 2023-01-14 18:25:20 发布

只要酸菜不要鱼

最新推荐文章于 2023-01-14 18:25:20 发布

阅读量2.5k

点赞数 2

分类专栏： Python 文章标签： python xpath

本文链接：https://blog.csdn.net/qq_45559536/article/details/106505265

版权

Python 专栏收录该内容

7 篇文章 1 订阅

订阅专栏

今天在使用scrapy框架爬取网页时，使用正确的xpath来爬取时，爬取的缺失空列表，代码如下：

# -*- coding: utf-8 -*-
import scrapy


class HaodfSpider(scrapy.Spider):
    name = 'haodf'
    start_urls = ['http://bbs.tnbz.com/forum-6-2.html']

    def parse(self, response):
        for item in response.xpath(r'//table[@summary="forum_6"]/tbody[not(contains(@id,"separatorline"))]'):
            url_s = item.xpath('./tr/th/a[3]/@href').get()
            yield scrapy.Request(url_s, callback=self.parse_s)

    def parse_s(self, response):
        print(response.xpath('//div/table[@class="plhin"]/tbody/tr/td//div[@class="t_fsz"]//td').extract())