python scrapy request_python – Scrapy Start_request解析

最新推荐文章于 2023-09-27 10:17:37 发布

weixin_39723655

最新推荐文章于 2023-09-27 10:17:37 发布

阅读量371

点赞数

文章标签： python scrapy request

我正在编写一个scrapy脚本来搜索和搜索网站的结果.我需要从网站搜索项目并从搜索结果中解析每个网址.我从Scrapy的start_requests开始,我将传递搜索查询并重定向到另一个函数解析,该解析将从搜索结果中检索URL.最后我调用另一个函数parse_item来解析结果.我能够提取所有搜索结果url,但我无法解析结果(parse_item不起作用).这是代码：

# -*- coding: utf-8 -*-

from scrapy.http.request import Request

from scrapy.spider import BaseSpider

class xyzspider(BaseSpider):

name = 'dspider'

allowed_domains = ["www.example.com"]

mylist = ['Search item 1','Search item 2']

url = 'https://example.com/search?q='

def start_requests(self):

for i in self.mylist:

i = i.replace(' ','+')

starturl = self.url+ i

yield Request(starturl,self.parse)

def parse(self,response):

itemurl = response.xpath(".//section[contains(@class, 'search-results')]/a/@href").extract()

for j in itemurl:

print j

yield Request(j,self.parse_item)

def parse_item(self,response):

print "hello"

'''rating = response.xpath(".//ul(@class = 'ratings')/li[1]/span[1]/text()").extract()

print rating'''

有谁可以帮助我.谢谢.

最佳答案我收到了Filtered offsite请求错误.我将允许的域名从allowed_domains = www.xyz.com更改为

xyz.com,它工作得很好.

weixin_39723655

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python scrapy request_python – Scrapy Start_request解析

我正在编写一个scrapy脚本来搜索和搜索网站的结果.我需要从网站搜索项目并从搜索结果中解析每个网址.我从Scrapy的start_requests开始,我将传递搜索查询并重定向到另一个函数解析,该解析将从搜索结果中检索URL.最后我调用另一个函数parse_item来解析结果.我能够提取所有搜索结果url,但我无法解析结果(parse_item不起作用).这是代码：# -*- coding: u...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。