图片抓取_Python抓取守望先锋所有英雄图片

今天的话题是一款游戏——《守望先锋》。提起名字,想必很多人热血沸腾,该游戏是由暴雪娱乐公司开发的一款第一人称射击游戏,于2016年5月24日全球上市,中国大陆地区由网易公司代理。本文不是为了赞叹该游戏昔日的辉煌,也不是为了感慨它是如何没落的。

本文旨在利用正则表达式抓取该游戏中所有英雄图片,也同时介绍一个很好用的方法:urlretrieve()方法,该方法可以将网络对象下载到本地,本文正是利用该方法下载所有英雄图片。程序如下:

# 导入相关模块import urllib.requestimport reimport time # 待抓取页面url地址url = 'https://ow.blizzard.cn/heroes/' # 获取请求头信息headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'}# 通过请求头,模拟浏览器访问req = urllib.request.Request(url, headers=headers)response = urllib.request.urlopen(req)# 获取响应内容html = response.read()# 利用正则表达式,匹配待抓取数据# 匹配待抓取英雄名字hero_names = re.findall('(.*?)', html.decode('utf-8'))# 匹配待抓取英雄图片对应的url地址img_urls = re.findall('', html.decode('utf-8'))# 下载全部英雄图片for i in range(len(img_urls)):    # 图片命名    img_file_name = hero_names[i]    # 下载图片    urllib.request.urlretrieve(img_urls[i], 'C:甥敳獲LenovoDesktop守望先锋%s.png' % img_file_name)    # 间断性访问    time.sleep(3)   

程序运行结果如下:

c1b87373ac7a193f9cb3cda289b04b51.png

抓取结果

以上就是目前该游戏中32位英雄的图片,已经全部抓取成功。可以看到,urlretrieve()方法是非常好用的。

好了,以上就是本期要介绍的内容,谢谢您的阅读!

86911c09766c0a074121d0bd0e17e23f.png

欢迎关注本人公众号:Python无忧

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值