python 爬取下一页_爬虫爬不进下一页了，怎么办

最新推荐文章于 2023-05-20 18:06:19 发布

嬉游君

最新推荐文章于 2023-05-20 18:06:19 发布

阅读量443

点赞数

文章标签： python 爬取下一页

本文链接：https://blog.csdn.net/weixin_32529429/article/details/113496558

版权

该楼层疑似违规已被系统折叠隐藏此楼查看此楼

#-*- coding: UTF-8 -*-

import scrapy

from hoho.items import HohoItem

import re

from scrapy.selector import Selector

import sys

reload(sys)

sys.setdefaultencoding( "UTF-8" )

class tongSpider(scrapy.Spider):

name = 'guwen'

start_urls=['http://www.shicifuns.com/v2/wenyan/list']

def parse(self,response):

papers = response.xpath('//div[@class="css_content"]/div/div[@class="css_body_left"]/div[@class="every_day"]/ul')

for paper in papers:

for p in paper.xpath('li'):

name = p.xpath('a/div/div[@class="poem_title"]/span/text()').extract()[0]

url = p.xpath('a/@href').extract()[0]

content = p.xpath('a/div/div[@class="po

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注