- 啊哈,又见面了,我把学校的项目做完了,然后趁自己还没生爬虫,就做了这个
- 老样子,还是看的知乎大神
- 然后这个做的是运用pexels网站,pexels是一个免费搜索图片的网站,然后就是运用它搜索后的url爬图片,好像中文不太好用,我搜的bikini →_→
- 好了,话不多说上代码
'''
根据知乎大神的分享
自动下载图片
代码作者:高佳乐
网站:https://www.pexels.com/
'''
##导入库
import requests ##导入requests库,发送请求用的
from lxml import etree ##导入lxml库以便xpath解析
import re ##导入re,正则表达式
import os ##导入os创建目录
import time ##爬虫就要有礼貌
import random ##导入随机库,伪装,减少被反
##定义类
class images():
def __init__(self): ##定义结构函数,把原网址放入
self.url='https://www.pexels.com/search/'
##获取html
def gethtml(self,url): ##定义一个获取html响应,发送请求的方法
html = requests.get(url) ##html是发送请求后返回的响应
html_text = html.content ##html_text是发送后返回的内容,如果直接text下边的xpath就会出错,直接在这content和解析utf-8
html_text = html_text.decode('utf-8') ##然后把返回的内容用utf8解析
return html_text ##返回用utf-8解析后的代码
##拼接url后获取
def geturl(self,key): ##这个方法是用于把你输入的关键字拼接成url然后返回
url = self.url+key+'/' ##把key 到网址后边拼接
return url ##返回拼接后的搜索网页
##用xpath