python 爬虫王者荣耀皮肤图片爬取

最新推荐文章于 2023-01-26 21:28:31 发布

乎你

最新推荐文章于 2023-01-26 21:28:31 发布

阅读量10w+

点赞数 3

分类专栏：爬虫文章标签： python 大数据 java 人工智能 docker

本文链接：https://blog.csdn.net/m0_50944918/article/details/111906840

版权

爬虫专栏收录该内容

45 篇文章 15 订阅

订阅专栏

#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
抓取王者荣耀皮肤
author: huni
date: 2020-12-29
"""

import requests
from bs4 import BeautifulSoup
from urllib import parse
import os


class Skin(object):
    def __init__(self):
        # 英雄的json数据
        self.hero_url = 'https://pvp.qq.com/web201605/js/herolist.json'
        # 英雄详细页的通用url前缀信息
        self.base_url = 'https://pvp.qq.com/web201605/herodetail/'
        # 英雄详细页url后缀信息
        self.detail_url = ''
        # 图片存储文件夹
        self.img_folder = 'skin'
        # 图片url的通用前缀
        self.skin_url = 'https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/'
        # 图片url的后缀信息
        self.skin_detail_url = ''

    def get_hero(self):
        """获取英雄的json数据"""
        request = requests.get(self.hero_url)
        hero_list = request.json()
        return hero_list

    def get_hero_skin(self, hero_name, hero_no):
        """获取详细页英雄皮肤展示的信息，并爬图"""
        url = parse.urljoin(self.base_url, self.detail_url)
        request = requests.get(url)
        request.encoding = 'gbk'
        html = request.text
        # 获取皮肤信息的节点
        soup = BeautifulSoup(html, 'html.parser')
        skip_list = soup.select('.pic-pf-list3')
        for skin_info in skip_list:
            # 获取皮肤名称
            img_names = skin_info.attrs['data-imgname']
            name_list = img_names.split('|')
            skin_no = 1
            # 循环下载皮肤图片
            for skin_name in name_list:
                self.skin_detail_url = '%s/%s-bigskin-%s.jpg' % (hero_no, hero_no, skin_no)
                skin_no += 1
                img_name = hero_name + '-' + skin_name + '.jpg'
                self.download_skin(img_name)

    def download_skin(self, img_name):
        """下载皮肤图片"""
        img_url = parse.urljoin(self.skin_url, self.skin_detail_url)
        request = requests.get(img_url)
        if request.status_code == 200:
            print('download-%s' % img_name)
            img_path = os.path.join(self.img_folder, img_name)
            with open(img_path, 'wb') as img:
                img.write(request.content)
        else:
            print('img error!')

    def make_folder(self):
        """创建图片存储文件夹"""
        if not os.path.exists(self.img_folder):
            os.mkdir(self.img_folder)

    def run(self):
        """脚本执行入口"""
        self.make_folder()
        hero_list = self.get_hero()
        for hero in hero_list:
            hero_no = str(hero['ename'])
            self.detail_url = hero_no + '.shtml'
            hero_name = hero['cname']
            self.get_hero_skin(hero_name, hero_no)


# 程序执行入口
if __name__ == '__main__':
    skin = Skin()
    skin.run()

大家如果觉得小编的代码有用，可以多多关注小编，
同时小编的公众号也开通了，大家可以关注下，后续进行粉丝回馈，大家一起学习python叭
在这里插入图片描述
打赏小编点这里哦

乎你

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python 爬虫王者荣耀皮肤图片爬取

#!/usr/bin/env python# -*- coding: utf-8 -*-"""抓取王者荣耀皮肤author: hunidate: 2020-12-29"""import requestsfrom bs4 import BeautifulSoupfrom urllib import parseimport osclass Skin(object): def __init__(self): # 英雄的json数据 self.h
复制链接

扫一扫