python爬取图片(正则表达式)

最新推荐文章于 2023-03-28 01:38:32 发布

SNA1L1

最新推荐文章于 2023-03-28 01:38:32 发布

阅读量1k

点赞数

分类专栏： pyhon菜鸟案例

本文链接：https://blog.csdn.net/weixin_44259979/article/details/111300691

版权

Python requests库图片爬取正则表达式文件保存

关键词由CSDN通过智能技术生成

pyhon菜鸟案例专栏收录该内容

5 篇文章 1 订阅

订阅专栏

利用py的requests库爬取图片

代码如下

import requests
import re
def getHtml(url):
    try:
        r=requests.get(url)
        r.raise_for_status()
        r.encoding='utf-8'
        print(r.text)
        return r.text
    except:
        return ""
def getImg(html):
    #reg=r'src="(http.+?\.jpg)"'
    reg=r'src="(http.+?\.jpg)"'
    imglist=re.findall(reg,html)
    print(imglist)
    i=0
    for url in imglist:
        with open(".\\wb\\"+str(i)+".jpg","wb") as fd:
            #response=requests.get(url)
            response = requests.get(url)
            fd.write(response.content)
            print(i,response.content)
            print('图片',i,"保存成功\n")
            i+=1
html = getHtml("https://www.tupianzj.com/meinv/mm/pxmnt/")
getImg(html)