python下载网页图片（2）

最新推荐文章于 2023-12-21 20:06:04 发布

巫祝

最新推荐文章于 2023-12-21 20:06:04 发布

阅读量2.1k

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/wudishine/article/details/11559691

版权

Python 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

在osChina上看到的一个小例子，直接运行有问题，就利用beautifulSoup给修改了下，

#-*- coding: UTF-8 -*-
import http
import urllib.request
from bs4 import BeautifulSoup
import os

def getContent():                     #从建立http连接，在网站中获取所有内容
    ur ="tu.duowan.com"
    conn = http.client.HTTPConnection(ur)
    conn.request("GET", "/m/meinv/index.html")
    r = conn.getresponse()
    data = r.read()                #.decode('utf-8') #编码根据实际情况酌情处理
    return data
 
def getImageUrl(data,filePath):             #将获取到img链接写到filePath文件
    sour = open(filePath, 'w')
    soup = BeautifulSoup(conte)
    for i in soup.find_all('img'):
        sour.write(i.get('src'))    #把从标签中提取的url地址写入文件
        sour.write(os.linesep)      #每次写入一个url地址，然后换行
    sour.close()
def downImage(filePath):                    #根据filePath里面的url自动下载图片
    tt = 0    #name
    sour = open(filePath)
    while 1:
        line = sour.readline()
        if line:
            #判断从文件中读取的url是不是图片类型，这里是jpg类型
            if(line.find('jpg')>0):
                data = urllib.request.urlopen(line).read()
                f = open('D:\\download\\tmp\\' + str(tt) + '.jpg', 'wb')   #在tmp文件中存储下载的图片
                f.write(data)
                f.close()
                tt = tt + 1
            else:
                pass
    sour.close()

conte = getContent()                          #建立 与网站的链接
soup = BeautifulSoup(conte)                   #获取网页的html信息
filePath = "D:\\download\\tmp\\1.txt"         #存储url的路径
getImageUrl(soup,filePath)                    #提取图片url的信息  
downImage(filePath)                           #下载图片  
print("Succeed download pictures")            #下载成功

巫祝

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python下载网页图片（2）

在osChina上看到的一个小例子，直接运行有问题，就利用beautifulSoup给修改了下，#-*- coding: UTF-8 -*-import httpimport urllib.requestfrom bs4 import BeautifulSoupimport osdef getContent(): #从建立http连接，在网站中获
复制链接

扫一扫