爬取优美图库图片

本文介绍了如何使用Python爬虫从优美图库网站获取图片。通过requests库进行HTTP请求,利用正则表达式匹配图片URL,然后下载并保存到本地。主要涉及的步骤包括获取HTML,解析图片链接,以及保存图片到指定文件夹。
摘要由CSDN通过智能技术生成
# 爬取优美图库图片

import requests
import re

proxy_support = requests

#获取URL的html
def Get_html(url):
    header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36'}
    r = requests.get(url,headers = header) #用Get方法并改变headers
    r.encoding = r.apparent_encoding
    return r.text

#获取图片相对应的URL
def Get_Image_url(html):
    Image_urls = re.compile('http://i1.whymtj.com/uploads/tu/201903/9999/.*?\.jpg').findall(html) # 用正则表达式从HTML中获取图片的URL
    return Image_urls

# 从每个图片对应的URL中获取信息,并保存在文件夹里
def Save_Image(Image_url):
    r = requests.get(Image_url)
    root = 'C:\\Users\\18477214811\\Desktop\\Beautiful Image\\' # 保存图片的路径
    path = root + Image_url.split('/')[-1] # Image_url.split('/')[-1]为文件的名字
    with open (path,'wb') as f:
        f.write(r.content)
        f.close()

# 主函数
def main():
    #爬取三页的图片
    count 
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值