[python]代码库import urllib.request
import re
# 获取主页源码
url = 'https://pvp.qq.com/web201605/herolist.shtml'
a = urllib.request.urlopen(url) # 访问网页
a = a.read() # 读取源码
a = a.decode('gbk') # 转码为gbk
# 获取英雄名称和ID
a = (re.compile('输入英雄不存在,请重新输入' + "(.*?)" + '英雄介绍', re.S).findall(a))[0] # 取主要源码
id = re.compile('
name = re.compile('height="91" alt="' + '(.*?)' + '">').findall(a) # 取名字
print('本次共抓取到' + str(len(id)) + '个英雄数据')
for i in range(0, len(id) + 1): # 对列表位置进行循环
url1 = 'https://pvp.qq.com/web201605/herodetail/' + id[i] + '.shtml' # 英雄主页网址
url1 = ((urllib.request.urlopen(url1)).read()).decode('gbk') # 获取源码,并且转码为gbk
pf = re.compile('data-imgname="' + '(.*?)' + '">', re.S).findall(url1) # 取出皮肤名字
for i1 in range(0, len(pf)): # 对皮肤列表进行循环
urllib.request.urlretrieve(url2, f + '/' + name[i] + '-' + pf[i1] + '.jpg') # 下载