这里我们来简单爬取一下英雄联盟的英雄信息和英雄图片
代码如下:
import requests
import json
import re
import os
class Grab_img(object):
hero_img_list = []
def __init__(self,url):
self.url = url
def grab_id(self):
response = requests.get(self.url)
pat = r"\"keys\":(.+),\"data\""
hero_id = json.loads(str(re.findall(pat, response.text))[2:-2])
for i in hero_id:
self.hero_img_list.append('http://ossweb-img.qq.com/images/lol/web201310/skin/big' + i + '000.jpg')
def storage_img(self):
for i in self.hero_img_list:
root = "E://photo//"
# 文件名
path = root + i.split("/")[-1]
# 判断根目录是否存在
if not os.path.exists(root):
os.mkdir(root)
# 判断文件是否存在
if not os.path.exists(path):
r = requests.get(i)
with open(path, "wb") as f:
f.write(r.content)
print("文件保存成功~~")
else:
print("文件已存在~~")
def main(self):
#获取英雄ID
self.grab_id()
#下载保存图片
self.storage_img()
if __name__ == '__main__':
try:
t = Grab_img("http://lol.qq.com/biz/hero/champion.js")
t.main()
except:
print("爬取出错啦~~~")
以上就是用python爬取lol图片的代码 下载后位置保存在 E://photo// 。