scrapy多页爬虫中根据参数跳转到不同函数进行解析的问题——python字典的使用...

需求:涉及到同一个网站的多页爬虫问题时,需要进行不同的Xpath解析操作时

考虑:可以设置参数,根据参数进行不同的跳转,如Java中的switch,python中有相似作用的字典,且效率更高

func_dict["跳转参数"],因为这个跳转参数是字符串,所以需要对item进行字符串转化

代码如下:

#创建字典
func_dict = {"0": self.parse_allQ, "1": self.parse_lastR, "2": self.parse_irmInf,
             "3": self.parse_interC, "4": self.parse_mostSR, "5": self.parse_microBl}
for url_suffix in response.xpath("//div[@class='Menubox22']/ul/li"):
    url = "http://irm.cninfo.com.cn/ircs/" + re.findall(r"/(.+)", url_suffix.xpath('@onclick').extract_first().split('\'')[3])[0]
    
    #print "func_dict>>>>>>>>>>>>>>>>>>>", func_dict[str(item)]
    #根据参数跳转到不同的解析函数
    yield scrapy.Request(url, callback=func_dict[str(item)])
    item = item + 1

转载于:https://my.oschina.net/u/3636678/blog/1859662

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值