鸟与虫（四）pexels搜到的我都想要，

最新推荐文章于 2024-06-11 18:00:47 发布

Adorable_new

最新推荐文章于 2024-06-11 18:00:47 发布

阅读量696

点赞数

分类专栏：菜鸡练习文章标签： Python 爬虫图片

本文链接：https://blog.csdn.net/Adorable_new/article/details/81112395

版权

本文介绍了一个Python爬虫项目，利用Pexels网站的免费图片资源，搜索并下载图片。作者分享了自己的学习过程，并展示了部分爬取的图片。

摘要由CSDN通过智能技术生成

啊哈，又见面了，我把学校的项目做完了，然后趁自己还没生爬虫，就做了这个
老样子，还是看的知乎大神
然后这个做的是运用pexels网站，pexels是一个免费搜索图片的网站，然后就是运用它搜索后的url爬图片,好像中文不太好用，我搜的bikini →_→
好了，话不多说上代码

'''
    根据知乎大神的分享
    自动下载图片
    代码作者：高佳乐
    网站：https://www.pexels.com/
'''

##导入库
import requests                                     ##导入requests库，发送请求用的
from lxml import etree                              ##导入lxml库以便xpath解析
import re                                           ##导入re，正则表达式
import os                                           ##导入os创建目录
import time                                         ##爬虫就要有礼貌
import random                                       ##导入随机库，伪装，减少被反

##定义类
class images():
    def __init__(self):                             ##定义结构函数，把原网址放入
        self.url='https://www.pexels.com/search/'

    ##获取html
    def gethtml(self,url):                          ##定义一个获取html响应，发送请求的方法
        html = requests.get(url)                    ##html是发送请求后返回的响应
        html_text = html.content                    ##html_text是发送后返回的内容，如果直接text下边的xpath就会出错，直接在这content和解析utf-8
        html_text = html_text.decode('utf-8')       ##然后把返回的内容用utf8解析
        return html_text                            ##返回用utf-8解析后的代码

    ##拼接url后获取
    def geturl(self,key):                           ##这个方法是用于把你输入的关键字拼接成url然后返回
        url = self.url+key+'/'                      ##把key 到网址后边拼接
        return url                                  ##返回拼接后的搜索网页

    ##用xpath