python使用正则爬取图片

最新推荐文章于 2023-08-31 14:06:36 发布

王小波_Libo

最新推荐文章于 2023-08-31 14:06:36 发布

阅读量1.8k

点赞数 1

分类专栏： # Python小项目

本文链接：https://blog.csdn.net/qq_38900441/article/details/79951178

版权

Python小项目专栏收录该内容

21 篇文章 3 订阅

订阅专栏

# encoding:utf-8
import re # 使用正则 匹配想要的图片
import requests #使用requests得到网页源码
num = 1
# 定义mzt函数
def mzt():

          # 这个是用来编辑图片的名字 (因为不喜欢看他原来图片的名字感觉乱乱的)
        for i in range(1, 3):  # 循环100次 （可以用三元运算）
            # 得到图片的链接 并设置编码格式
            yuan = requests.get('http://www.mzitu.com/zipai/comment-page-' + str(i)+'/#comments').content.decode('utf-8')  
            demo = re.compile('<img src="(.*?)" .*?>', re.S)  # 找到图片正则
            list1 = demo.findall(yuan) # 去源码中找匹配到的这个链接
            write_os(list1)
def write_os(list1):
        global num
        for j in list1: # 遍历你得到的图片
            num += 1 # 循环一次加一
            yuan = requests.get(j).content # 得到你图片的内容
            # 写进本地
            with open('E:\\testtupian\\' + str(num) + '.jpg', 'wb') as f:
                f.write(yuan) # 写进去
                f.close() # 关闭文件


if __name__ == '__main__': # 代码测试片段
   mzt() # 调用你的函数