爬取优美图库图片

最新推荐文章于 2023-08-21 08:00:00 发布

joker6868

最新推荐文章于 2023-08-21 08:00:00 发布

阅读量1.5k

点赞数

分类专栏： Python 爬虫爬取图片文章标签：新手请多指教

本文链接：https://blog.csdn.net/joker6868/article/details/80637297

版权

本文介绍了如何使用Python爬虫从优美图库网站获取图片。通过requests库进行HTTP请求，利用正则表达式匹配图片URL，然后下载并保存到本地。主要涉及的步骤包括获取HTML，解析图片链接，以及保存图片到指定文件夹。

摘要由CSDN通过智能技术生成

# 爬取优美图库图片

import requests
import re

proxy_support = requests

#获取URL的html
def Get_html(url):
    header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36'}
    r = requests.get(url,headers = header) #用Get方法并改变headers
    r.encoding = r.apparent_encoding
    return r.text

#获取图片相对应的URL
def Get_Image_url(html):
    Image_urls = re.compile('http://i1.whymtj.com/uploads/tu/201903/9999/.*?\.jpg').findall(html) # 用正则表达式从HTML中获取图片的URL
    return Image_urls

# 从每个图片对应的URL中获取信息，并保存在文件夹里
def Save_Image(Image_url):
    r = requests.get(Image_url)
    root = 'C:\\Users\\18477214811\\Desktop\\Beautiful Image\\' # 保存图片的路径
    path = root + Image_url.split('/')[-1] # Image_url.split('/')[-1]为文件的名字
    with open (path,'wb') as f:
        f.write(r.content)
        f.close()

# 主函数
def main():
    #爬取三页的图片
    count