Python网络爬虫--项目实战--用scrapy框架爬取王者荣耀英雄信息

本文介绍如何使用Python的Scrapy框架进行网络爬虫实战,具体项目为爬取王者荣耀游戏中的英雄信息。通过wzry.py文件设置爬虫逻辑,以及pipelines.py处理爬取的数据。
摘要由CSDN通过智能技术生成

wzry.py

import scrapy

from LearnScrapy.items import HeroItem


class WzrySpider(scrapy.Spider):
    name = 'wzry'
    allowed_domains = ['pvp.qq.com']
    start_urls = ['https://pvp.qq.com/web201605/herolist.shtml']

    hero_detail_base_url = "https://pvp.qq.com/web201605/"

    def parse(self, response):
        # print(response)
        hero_list = response.xpath("//div[contains(@class, 'herolist-content')]/ul[contains(@class, 'herolist')]/li/a/@href").extract()
        # print(hero_list)
        # for hero_detail in hero_list:
            # yield scrapy.Request(url=self.hero_detail_base_url + hero_detail, callback=self.parse_hero_detail, meta={"msg": "ok"})
            # yield scrapy.Request(url=response.urljoin(hero_detail), callback=self.parse_hero_detail, meta={"msg": "ok"})
            # yield response.follow(url=hero_detail, callback=self.parse_hero_detail, meta={"msg": "ok"})

        requests = response.follow_all(urls=hero_list, callback=self.parse_hero_detail, meta={
   "msg": "ok"}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值