python使用正则爬取图片

# encoding:utf-8
import re # 使用正则 匹配想要的图片
import requests #使用requests得到网页源码
num = 1
# 定义mzt函数
def mzt():

          # 这个是用来编辑图片的名字 (因为不喜欢看他原来图片的名字感觉乱乱的)
        for i in range(1, 3):  # 循环100次 (可以用三元运算)
            # 得到图片的链接 并设置编码格式
            yuan = requests.get('http://www.mzitu.com/zipai/comment-page-' + str(i)+'/#comments').content.decode('utf-8')  
            demo = re.compile('<img src="(.*?)" .*?>', re.S)  # 找到图片正则
            list1 = demo.findall(yuan) # 去源码中找匹配到的这个链接
            write_os(list1)
def write_os(list1):
        global num
        for j in list1: # 遍历你得到的图片
            num += 1 # 循环一次加一
            yuan = requests.get(j).content # 得到你图片的内容
            # 写进本地
            with open('E:\\testtupian\\' + str(num) + '.jpg', 'wb') as f:
                f.write(yuan) # 写进去
                f.close() # 关闭文件


if __name__ == '__main__': # 代码测试片段
   mzt() # 调用你的函数

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值