前言
大家早好、午好、晚好吖 ❤ ~欢迎光临本文章
开发环境 :
-
python 3.8 运行代码
-
pycharm 2022.3 辅助敲代码
模块使用:
-
requests —> 数据请求模块 需要安装
-
re 正则表达式 内置模块 不需要安装
-
os 文件操作模块 内置模块 不需要安装 --> 自动创建文件夹 把每个英雄都自动创建对应文件
第三方模块安装:
win + R 输入cmd 输入安装命令 pip install 模块名
(如果你觉得安装速度比较慢, 你可以切换国内镜像源)
完整源码、教程 点击此处跳转文末名片获取 ,我都放在这里了。
代码基本四个步骤:
-
发送请求, 模拟浏览器对于url地址发送请求
-
获取数据, 获取服务器返回响应数据
-
解析数据, 提取我们想要的数据内容
-
保存数据, 把需要数据保存到本地
代码展示
import os.path
# 导入数据请求模块
import requests
# 导入正则表达式
import re
模拟浏览器
headers = {
# User-Agent 用户代理 表示浏览器基本身份信息
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'
}
英雄列表数据包 ctrl + /
html = 'https://*****/web201605/js/herolist.json'
发送请求 response.json() 获取响应的json数据
json_data = requests.get(html, headers=headers).json()
for index in json_data:
# 键值对取值
HeroName = index['cname'] # 英雄名字
HeroID = index['ename'] # 英雄ID
请求url地址 yao 英雄详情页
url = f'https://*****/web201605/herodetail/{HeroID}.shtml'
发送请求
response = requests.get(url, headers=headers)
转码
response.encoding = 'gbk'
提取名字
name_list = re.findall('data-imgname="(.*?)">', response.text)[0].split('|')
给数字
num = 1
一个一个提取名字
for name in name_list:
# 名字处理
name = name.split('&')[0]
源码、解答、教程+V:qian97378获取
# 图片链接:
link = f'https://*****/images/yxzj/img201606/skin/hero-info/{HeroID}/{HeroID}-bigskin-{num}.jpg'
filename = f'img\\{HeroName}\\'
if not os.path.exists(filename):
os.makedirs(filename)
二进制数据获取
img_content = requests.get(link, headers=headers).content
with open(filename + name + '.jpg', 'wb') as f:
f.write(img_content)
每次循环都加1
num += 1
print(link, name)
尾语 💝
好了,今天的分享就差不多到这里了!
完整代码、更多资源、疑惑解答直接点击下方名片自取即可。
对下一篇大家想看什么,可在评论区留言哦!看到我会更新哒(ง •_•)ง
喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!