Python 简单的爬图片，下载到本地，requests+beautifulsoup框架

最新推荐文章于 2024-04-08 08:05:22 发布

码点

最新推荐文章于 2024-04-08 08:05:22 发布

阅读量1.6k

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/qq_31939617/article/details/85006719

版权

python 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

先上图：
在这里插入图片描述

在这里插入图片描述

源码：

from urllib import request
from bs4 import BeautifulSoup
import os

# 新建文件夹
curPath = os.getcwd()
temPath = 'tu2345'
targetPath = curPath+os.path.sep+temPath

if not os.path.exists(targetPath):
    os.makedirs(targetPath)
    print("tiantang新建成功")
else:
    print("路径已经存在")


#get_img函数是取数据的
def get_img(list_url):
    response = request.urlopen(list_url)
    page = response.read()
    html_doc = page.decode('gbk')
    soup = BeautifulSoup(html_doc, "html5lib")
    #print(soup)
    div = soup.find('div',class_='main_cont')
    # for name in div.find_all('p'):
    #     print(name)
    #     n1 = name.find("p",attrs={"style","text-align: center"})
    #     n2 = n1.find('img').get('src')
    #     img_path = "tu2345/"+n2.string+".jpg"

    i = 0
    for name in div.find_all('img'):
        i += 1
        #print(name.get('alt'))
        print(name.get('src'))
        img_path = "tu2345/" + str(i)+".jpg"
        #将远程数据下载到本地，第二个参数就是要保存到本地的文件名
        request.urlretrieve(name.get('src'), img_path)
        print("----第"+str(i)+"张保存完成----")



#获取网页
url="http://news.duote.com/55/162784.html"
get_img(url)
print("当页网址:"+url)

初学，作记号。