python爬虫学习10：使用bs4批量下载图片

<编程路上>

已于 2022-07-04 15:31:34 修改

阅读量631

点赞数

分类专栏：爬虫文章标签： python 爬虫学习

于 2022-07-04 15:16:34 首次发布

本文链接：https://blog.csdn.net/weixin_43788986/article/details/125600732

版权

爬虫专栏收录该内容

28 篇文章 5 订阅

订阅专栏

使用bs4抓取网页图片，流程为：
1、拿到网页的源代码
2、从子页面中找到所需图片的下载地址
3、下载图片到本地

import requests
from bs4 import BeautifulSoup
from fake_useragent import UserAgent

#获取html代码
url = "http://bizhi360.com/meinv/"
headers= {'User-Agent':str(UserAgent().random)}
resp = requests.get(url,headers=headers)
resp.encoding = 'UTF-8'  # 处理乱码

#存入BeautifulSoup
page = BeautifulSoup(resp.text, "html.parser")  # 指定html解析器
resp.close()
# print(page)

#找到子页面网址位置
trs=page.find("ul")
trss=trs.find_all("a")
#print(trss)
name=list()
src=list()
#组合成子页面网址
for i in trss:
    src.append("http://bizhi360.com"+i.get("href"))

#在子页面获取下载网址和图片名字，保存到本地
for i in range(0, len(src)):
    pageurl=src[i]
    res = requests.get(pageurl, headers=headers)
    res.encoding = 'UTF-8'  # 处理乱码
    #打开子页面获取下载图片地址
    pages = BeautifulSoup(res.text, "html.parser")  # 指定html解析器
    #print(pages)
    pic=pages.find("a",attrs={"class": "download"})
    name = pages.find("h1", attrs={"class": "title"})
    # print(name.text)
    #print(pic.get("href"))#获得下载网址：http://pic.bizhi360.com/bbpic/76/10676.jpg
    # 下载图片
    picture = requests.get(pic.get("href"))
    #name=name+".jpg"
    with open("jpgs/" + name.text+".jpg", mode="wb") as f:
        f.write(picture.content)  # 图片内容写入文件
    f.close()
    print("over!!!", name.text)
    res.close()

最后下载到一个文件夹：
在这里插入图片描述

<编程路上>

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
python爬虫学习10：使用bs4批量下载图片

首先申明使用的图片下载网址是一个免费的网站，可以免费下载图片：使用bs4抓取网页图片，流程为：1、拿到主页面的前端源码，然后提取子页面的链接地址2、从子页面中找到图片的下载地址3、下载图片最后下载到一个文件夹：.........
复制链接

扫一扫