必会Python技能！教你如何从官网爬取高清皮肤壁纸_python爬三国杀的皮肤图片-CSDN博客

本文链接：https://blog.csdn.net/weixin_62853513/article/details/131495459

目录标题

前言

大家早好、午好、晚好吖 ❤ ~欢迎光临本文章

开发环境 :

python 3.8 运行代码
pycharm 2022.3 辅助敲代码

模块使用:

requests —> 数据请求模块需要安装
re 正则表达式内置模块不需要安装
os 文件操作模块内置模块不需要安装 --> 自动创建文件夹把每个英雄都自动创建对应文件

第三方模块安装：

win + R 输入cmd 输入安装命令 pip install 模块名

(如果你觉得安装速度比较慢, 你可以切换国内镜像源)

完整源码、教程 点击此处跳转文末名片获取 ，我都放在这里了。

代码基本四个步骤:

发送请求, 模拟浏览器对于url地址发送请求
获取数据, 获取服务器返回响应数据
解析数据, 提取我们想要的数据内容
保存数据, 把需要数据保存到本地

代码展示

import os.path

# 导入数据请求模块
import requests
# 导入正则表达式
import re

模拟浏览器

headers = {
    # User-Agent 用户代理 表示浏览器基本身份信息
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'
}

英雄列表数据包 ctrl + /

html = 'https://*****/web201605/js/herolist.json'

发送请求 response.json() 获取响应的json数据

json_data = requests.get(html, headers=headers).json()
for index in json_data:
    # 键值对取值
    HeroName = index['cname'] # 英雄名字
    HeroID = index['ename'] # 英雄ID

请求url地址 yao 英雄详情页

    url = f'https://*****/web201605/herodetail/{HeroID}.shtml'

发送请求

    response = requests.get(url, headers=headers)

转码

    response.encoding = 'gbk'

提取名字

    name_list = re.findall('data-imgname="(.*?)">', response.text)[0].split('|')

给数字

    num = 1

一个一个提取名字

    for name in name_list:
        # 名字处理
        name = name.split('&')[0]
        源码、解答、教程+V：qian97378获取
        # 图片链接:
        link = f'https://*****/images/yxzj/img201606/skin/hero-info/{HeroID}/{HeroID}-bigskin-{num}.jpg'
        filename = f'img\\{HeroName}\\'
        if not os.path.exists(filename):
            os.makedirs(filename)

二进制数据获取

        img_content = requests.get(link, headers=headers).content
        with open(filename + name + '.jpg', 'wb') as f:
            f.write(img_content)

每次循环都加1

        num += 1
        print(link, name)

尾语 💝

好了，今天的分享就差不多到这里了！

完整代码、更多资源、疑惑解答直接点击下方名片自取即可。

对下一篇大家想看什么，可在评论区留言哦！看到我会更新哒(ง •_•)ง

喜欢就关注一下博主，或点赞收藏评论一下我的文章叭！！！

最后，宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇👇