基于python3.6的大量图片爬取，内含代码注释

最新推荐文章于 2022-06-21 12:37:06 发布

无情Array

最新推荐文章于 2022-06-21 12:37:06 发布

阅读量1.9k

点赞数 2

分类专栏： Python语言文章标签： python 网页爬虫一次性爬取大量图片

本文链接：https://blog.csdn.net/qq_37295506/article/details/79467835

版权

本文介绍如何使用requests库在Python3.6中实现对一个金毛犬主题网页的图片批量抓取，并详细解释了代码实现过程，图片保存到指定本地文件夹。

摘要由CSDN通过智能技术生成

运用requests-re技术路线，从一个网页（金毛犬网页）上大量爬取此网页上的图片并保存在指定路径

以下是实现代码

import requests    

import os

import re



#获取网页Html页面

def getHTMLText(url):
    try:
        r=requests.get(url,timeout=30)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        return ""



#为图片创建文件夹并大量保存
def get_img(ilt,html):
         ilt=re.findall(r'\"pic_url\"\:\"([^"]+\.jpg)\"',html)#正则表达式匹配字符串，字符串为图片网址，进入网页源码中查找出匹配字符串的特征

         root="D://picss//"
         for each in ilt:
             path=root+each.split('/')[-1]#用图片网址名称做为保存路径的名称
             try:
                 if not os.path.exists(root):
                      os.mkdir(root)
                 if not os.path.exists(path):
                      r=requests.get(each)

最低0.47元/天解锁文章

无情Array

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
基于python3.6的大量图片爬取，内含代码注释

运用requests-re技术路线，从一个网页（金毛犬网页）上大量爬取此网页上的图片并保存在指定路径以下是实现代码import requests import osimport re#获取网页Html页面def getHTMLText(url): try: r=requests.get(url,timeout=30) r.raise...
复制链接

扫一扫

专栏目录