python使用正则爬取图片

# encoding:utf-8
import re # 使用正则 匹配想要的图片
import requests #使用requests得到网页源码
num = 1
# 定义mzt函数
def mzt():

          # 这个是用来编辑图片的名字 (因为不喜欢看他原来图片的名字感觉乱乱的)
        for i in range(1, 3):  # 循环100次 (可以用三元运算)
            # 得到图片的链接 并设置编码格式
            yuan = requests.get('http://www.mzitu.com/zipai/comment-page-' + str(i)+'/#comments').content.decode('utf-8')  
            demo = re.compile('<img src="(.*?)" .*?>', re.S)  # 找到图片正则
            list1 = demo.findall(yuan) # 去源码中找匹配到的这个链接
            write_os(list1)
def write_os(list1):
        global num
        for j in list1: # 遍历你得到的图片
            num += 1 # 循环一次加一
            yuan = requests.get(j).content # 得到你图片的内容
            # 写进本地
            with open('E:\\testtupian\\' + str(num) + '.jpg', 'wb') as f:
                f.write(yuan) # 写进去
                f.close() # 关闭文件


if __name__ == '__main__': # 代码测试片段
   mzt() # 调用你的函数

阅读更多
想对作者说点什么?

博主推荐

换一批

没有更多推荐了,返回首页