今天的话题是一款游戏——《守望先锋》。提起名字,想必很多人热血沸腾,该游戏是由暴雪娱乐公司开发的一款第一人称射击游戏,于2016年5月24日全球上市,中国大陆地区由网易公司代理。本文不是为了赞叹该游戏昔日的辉煌,也不是为了感慨它是如何没落的。
本文旨在利用正则表达式抓取该游戏中所有英雄图片,也同时介绍一个很好用的方法:urlretrieve()方法,该方法可以将网络对象下载到本地,本文正是利用该方法下载所有英雄图片。程序如下:
# 导入相关模块import urllib.requestimport reimport time # 待抓取页面url地址url = 'https://ow.blizzard.cn/heroes/' # 获取请求头信息headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'}# 通过请求头,模拟浏览器访问req = urllib.request.Request(url, headers=headers)response = urllib.request.urlopen(req)# 获取响应内容html = response.read()# 利用正则表达式,匹配待抓取数据# 匹配待抓取英雄名字hero_names = re.findall('(.*?)', html.decode('utf-8'))# 匹配待抓取英雄图片对应的url地址img_urls = re.findall('', html.decode('utf-8'))# 下载全部英雄图片for i in range(len(img_urls)): # 图片命名 img_file_name = hero_names[i] # 下载图片 urllib.request.urlretrieve(img_urls[i], 'C:甥敳獲LenovoDesktop守望先锋%s.png' % img_file_name) # 间断性访问 time.sleep(3)
程序运行结果如下:
以上就是目前该游戏中32位英雄的图片,已经全部抓取成功。可以看到,urlretrieve()方法是非常好用的。
好了,以上就是本期要介绍的内容,谢谢您的阅读!