Python 保存网页上的图片

最新推荐文章于 2024-07-22 17:25:13 发布

wang1412

最新推荐文章于 2024-07-22 17:25:13 发布

阅读量5.1k

点赞数 3

本文链接：https://blog.csdn.net/wang1412/article/details/79540002

版权

使用Python保存网站上的图片。
测试网站是豆瓣电影上的海报网址
使用以下code成功的建立了一个文件夹，并且在其中
保存该页面上的17张海报图片（仅保存海报图片，其他图片不保存）。

使用`Python`保存网站上的图片。
测试网站是豆瓣电影上的海报网址
使用以下code成功的建立了一个文件夹，并且在其中
保存该页面上的17张海报图片（仅保存海报图片，其他图片不保存）。

from urllib import request
import os

def url_open(url):
    req = request.Request(url)
    response = request.urlopen(url)
    html = response.read()
    return html

def find_imgs(url):              #构造一个函数，返回一个存储了若干图片地址的列表
    html = url_open(url).decode('utf-8') #使用decode('utf-8') 建立一个str对象
    img_addrs = []                  #img_addrs是一个储存图片地址的列表
    a = html.find('img src=') #寻找图片地址的起始位置，如果没有找到find()会返回-1
    while a != -1:                  #将页面上所有海报图片全部提取
        b = html.find('.jpg',a, a+100) #从a-a+100区间，寻找图片地址的末尾位置，
        if b != -1:
            c = html[a+9:b+4]       #c就是在html中截取到的图片地址
            if 'view' in c:      #进行一步筛选，只想保留海报图片，不需要其他图片
                print(c)