爬取网站图片(1.正则表达式)

爬取网站图片(1.正则表达式)

如果文件夹不存在,就创建文件夹。

 path = "E:\\images\\"
 if os.path.exists(path):
            pass
        else:
            os.mkdir(path)
import re
import requests
import os
import urllib.request

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)  Chrome/83.0.4103.116 Safari/537.36'
}   #加入请求头

url = 'https://www.vmgirls.com/13344.html'
res = requests.get(url, headers=headers)    #请求网页

images = re.findall('<img alt=".*?" src=".*?" data-src="(.*?)" .*?>',res.content.decode('utf-8'))   #获取图片链接
count = 0
os.makedirs('E:\\images\\',exist_ok=True)   #文件夹
for image in images:
    count = count + 1
    fobj = open("E:\\images\\" + str(count) + image[-5:],"wb")  #路径
    data = requests.get(image,headers=headers)      #再次请求图片链接
    fobj.write(data.content)    #写入
    fobj.close()
    print("dowmloaded " + str(count) + image[-5:])
   



在这里插入图片描述
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值