获取斗鱼图片

一、总体思路

从网页代码里获得你要图片,需要简单的分析一下该网页源代码:

当我们把鼠标移到地址上的时候就会出现该图片,这个就是我们要爬取的图片。这个图片是在 data-original 后面,我们就需要进行匹配,通过正则表达式很快就可以达到目的。网页代码片段如下:

1
<img data-original="https://rpic.douyucdn.cn/a1704/03/15/1032029_170403155245.jpg" src="https://rpic.douyucdn.cn/a1704/03/15/1032029_170403155245.jpg" width="283" height="163" style="display: block;">

则正则表达式为 data-original="(.*?\.(jpg|png)) 这样我们就获取到了这个页面上所有的 jpg 和 png 图片,最后通过 urlretrieve 这个方法把图片保存到你想要放的地方。

二、实现的代码

# coding:utf8
import urllib.request
import re
import time
 # 通过filename设置路径和名字
response=urllib.request.urlopen('https://www.douyu.com/directory/game/TVgame')
html=response.read()
html=html.decode('utf-8')
print (html)
imglist=re.findall(r'data-original="(.*?\.(jpg|png))"',html)
print (imglist)
x=0
for imgurl in imglist:
    print ('下载图片 %s'%imgurl[0])
    if imgurl[1]=='gif':
        urllib.request.urlretrieve(imgurl[0],filename='F:\douyu\%d.gif'%x)
    else:
        urllib.request.urlretrieve(imgurl[0],filename='F:\douyu\%d.jpg'%x)
    x+=1
    time.sleep(1)


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值