钩子函数就是中间件,利用的编程思想就是AOP编程,也就是面向切面编程思想,比如在用户端以及在服务器端进行“切开”,设置钩子函数,通俗地讲就是两者之间设置一个函数组件进行某些操作达到比如反爬,防御攻击等的目的。
常用的钩子函数有:
before_first_request(在第一次请求执行之前执行);
before_request在请求执行之前执行);
after_request(注册一个函数,如果没有异常抛出,在每次请求之后执行)。
(1)三个钩子函数中,最常用的是before_request,现直接上代码示范一下;
from flask import Blueprint
from sqlalchemy import desc
from .models import * # 这步很重要,不然models.py不执行
from .exts import cache
# 定义一个蓝图
user_bp = Blueprint('u_bp', __name__)
@user_bp.route('/')
@cache.cached(timeout=20) # 给视图函数加缓存,20秒的超时时间
def index():
time.sleep(5)
return 'index'
@user_bp.before_request
def before_func():
print("先走这里这个钩子函数")
return "走起,请求前先走这里!"
效果如下,用户请求发起后先走钩子函数:
(2)实现简单反爬
# 写一个脚本模拟一个爬虫
import requests
res = requests.get('http://127.0.0.1:5000/')
print(res.text)
# 从flask导入request模块,该模块可以获取到用户的user-agent的值来实现简单反爬
@user_bp.before_request
def before_func():
print("先走这里这个钩子函数")
# 实现简单反爬
if request.user_agent.string.startswith('python'):
return "您正在使用python爬虫,再见"
return "走起,请求前先走这里!"
运行模拟爬虫脚本之后的效果如下
(3)针对IP实现简单反爬
@user_bp.before_request
def before_func():
print("先走这里这个钩子函数")
# 针对IP实现简单反爬
u_ip = request.remote_addr
if cache.get(u_ip):
return "靓仔,别爬了!"
else:
cache.set(u_ip, 'value', timeout=1)
效果如下,before_func函数会使用cache模块获取用户的ip,如果某个用户的IP请求太频繁会进行警告,若是初次访问则对该IP设置有效期,本次示例是1秒内限制访问,1秒后还是可以再次访问,没做其他复杂限制
The end! Thanks