爬取网页所有.jpg文件图片的简单代码的模板

最新推荐文章于 2023-10-09 13:12:32 发布

记着这双眼睛

最新推荐文章于 2023-10-09 13:12:32 发布

阅读量550

点赞数 1

分类专栏： python爬虫文章标签： Python爬虫图片爬取 requests 正则表达式图片下载

本文链接：https://blog.csdn.net/m0_52009869/article/details/115644434

版权

python爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

#爬取网页所有.jpg文件图片的简单代码的模板
##只是爬虫小白，还请各位前辈们指导

#导入requests与re库
import requests
import re


#需要爬取工作的网站，这里看自己找什么网页了，例如豆瓣，淘宝，图片库等等，只需粘贴复制即可。（加密除外）
url = ""
page = requests.get(url).text
#r'src="(http.+?.jpg)"'
res = re.compile(r'src="(http.+?.jpg)"')
reg = re.findall(res,page)
#print(reg)

#遍历
num = 0
for ul in reg:
    url = ul.lstrip('<img src="').rstrip('"')
    print(url)
    filename = str(num) + ".jpg"
    res = requests.get(url)
    #保存本地 “wb”读写模式
    with open(filename,"wb") as f:
        f.write(res.content)
    num = num + 1