微服务（二）Sentinel限流熔断

最新推荐文章于 2024-08-23 15:54:50 发布

大小不少年

最新推荐文章于 2024-08-23 15:54:50 发布

阅读量662

点赞数

文章标签： java

本文链接：https://blog.csdn.net/zhangzhanpu/article/details/120377059

版权

一、Sentinel简介

1.概述

Sentinel（分布式系统的流量防卫兵）是阿里开源的一套用于服务容错的综合性解决方案。它以流量为切入点, 从流量控制、熔断降级、系统负载保护等多个维度来保护服务的稳定性。

Sentinel核心分为两个部分：

核心库（java客户端）：能够运行于所有 Java 运行时环境，同时对Spring Cloud 等框架也有较好的支持。
控制台（Dashboard）：基于 Spring Boot 开发，打包后可以直接运行。

2.安装Sentinel服务

第一步：打开sentinel下载网址

https://github.com/alibaba/Sentinel/releases

第二步：下载jar包（可以存储到一个sentinel目录），如图

第三步：在sentinel对应目录，打开命令行（cmd），启动运行sentinel

java -Dserver.port=8180 -Dcsp.sentinel.dashboard.server=localhost:8180 -Dproject.name=sentinel-dashboard -jar sentinel-dashboard-1.8.0.jar

3.访问Sentinel服务

第一步：假如Sentinel启动ok，通过浏览器进行访问测试，如图

第二步：登录sentinel，默认用户名和密码都是sentinel

二、Sentinel限流入门

1.概述

数据库连接池、线程池等在使用时都会跟定一个限定的值，这就是限流的一种设计。限流的目的防止恶意请求流量、恶意攻击，或者防止流量超过系统峰值。

2.sentinel集成实现

第一步：sentinel应用于服务消费方（Consumer），在消费方添加依赖如下

<dependency>
    <groupId>com.alibaba.cloud</groupId>
    <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
</dependency>

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>

第二步：打开服务消费方配置文件application.yml，添加sentinel配置

spring:
  cloud:
    sentinel:
      transport:
         port: 8099 #跟sentinel控制台交流的端口,随意指定一个未使用的端口即可
         dashboard: localhost:8180 # 指定sentinel控制台地址。

第三步：启动服务提供者，服务消费者，然后在浏览器访问消费者url，如图

在这里插入图片描述

第四步：刷新sentinel控制台，检测服务列表，如图

在这里插入图片描述

注：Sentinel的控制台其实就是一个SpringBoot编写的程序，我们需要将我们的服务注册到控制台上，即在微服务中指定控制台的地址，并且还要在消费端开启一个与sentinel控制台传递数据端的端口，控制台可以通过此端口调用微服务中的监控程序来获取各种信息。

3.sentinel限流入门案例

我们设置一下指定接口的流控(流量控制)，QPS（每秒请求次数）单机阈值为1，代表每秒请求不能超出1次，要不然就做限流处理，处理方式直接调用失败。

第一步：选择要限流的链路，如图

第二步：设置限流策略

在这里插入图片描述

第三步：反复刷新访问消费端服务，检测是否有限流信息输出

在这里插入图片描述

三、Sentinel流控规则分析

1.阈值类型分析

QPS(Queries Per Second)：当调用相关url对应的资源时，QPS达到单机阈值时，就会限流。
线程数：当调用相关url对应的资源时，线程数达到单机阈值时，就会限流。

2.设置限流模式

Sentinel的流控模式代表的流控方式，默认为直接，还有关联、链路。

2.1 直接模式

Sentinel默认的流控处理就是【直接—>快速失败】

2.2 关联模式

当关联的资源达到阈值，就限流自己。例如设置了关联资源为/url2时，假如关联资源/url2的qps阀值超过1时，就限流/url1接口（关联资源达到阀值，是本资源接口被限流了）。这种关联模式有什么应用场景呢？我们举个例子，订单服务中会有2个重要的接口，一个是读取订单信息接口，一个是写入订单信息接口。在高并发业务场景中，两个接口都会占用资源，如果读取接口访问过大，就会影响写入接口的性能。业务中如果我们希望写入订单比较重要，要优先考虑写入订单接口。那就可以利用关联模式；在关联资源上面设置写入接口，资源名设置读取接口就行了；这样就起到了优先写入，一旦写入请求多，就限制读的请求。例如：

2.3 链路模式

第一步：链路模式只记录指定链路入口的流量。也就是当多个服务对指定资源调用时，假如流量超出了指定阈值，则进行限流。被调用的方法用@SentinelResource进行注解，然后分别用不同业务方法对此业务进行调用，假如A业务设置了链路模式的限流,在B业务中是不受影响的。

@Service
public class ConsumerService{
    @SentinelResource("doGetResource")
    public String doGetResource(){
        return "doGetResource";
    }
}

第二步：接下来我们在/consumer/doRestEcho1对应的方法中对ConsumerService中的doGetResource方法进行调用(应用consumerService对象之前,要先在doRestEcho01方法所在的类中进行consumerService值的注入)。例如:

@GetMapping("/consumer/doRestEcho1")
    public String doRestEcho01() throws InterruptedException {
        consumerService.doGetResource();
        String url="http://localhost:8081/provider/echo/"+server;
        //远程过程调用-RPCreturn restTemplate.getForObject(url,String.class);//String.class调用服务响应数据类型
    }

第三步： 其路由规则如下：

在这里插入图片描述

注：流控模式为链路模式时，假如是sentinel 1.7.2以后版本，Sentinel Web过滤器默认会聚合所有URL的入口为sentinel_spring_web_context，因此单独对指定链路限流会不生效，需要在application.yml添加如下语句来关闭URL PATH聚合,例如：

sentinel:
     web-context-unify: false

第四步：修改配置以后，重新sentinel，并设置链路流控规则，然后再频繁对链路/consumer/doRestEcho1进行访问，检测是否会出现500异常。

在这里插入图片描述

3.设计限流效果

3.1 快速失败

流量达到指定阈值，直接返回报异常。

3.2 WarmUp（预热）

WarmUp也叫预热，根据codeFactor（默认3）的值，（阀值/codeFactor）为初始阈值，经过预热时长，才到达设置的QPS的阈值，假如单机阈值为100，系统初始化的阈为 100/3 ，即阈值为33，然后过了10秒，阈值才恢复到100。这个预热的应用场景，如：秒杀系统在开启的瞬间，会有很多流量上来，很有可能把系统打死，预热方式就是把为了保护系统，可慢慢的把流量放进来，慢慢的把阈值增长到设置的阈值。例如：

3.3 排队等待

从字面上面就能够猜到，匀速排队，让请求以均匀的速度通过，阈值类型必须设成QPS，否则无效。比如有时候系统在某一个时刻会出现大流量，之后流量就恢复稳定，可以采用这种排队模式，大流量来时可以让流量请求先排队，等恢复了在慢慢进行处理，例如：

四、Sentinel降级入门

1.概述

除了流量控制以外，对调用链路中不稳定的资源进行熔断降级也是保障高可用的重要措施之一。由于调用关系的复杂性，如果调用链路中的某个资源不稳定，最终会导致请求发生堆积。
Sentinel 熔断降级会在调用链路中某个资源出现不稳定状态时（例如调用超时或异常比例升高），对这个资源的调用进行限制，让请求快速失败，避免影响到其它的资源而导致级联错误。当资源被降级后，在接下来的降级时间窗口之内，对该资源的调用都自动熔断（默认行为是抛出 DegradeException）。

准备工作：

修改ConumserController 类中的doRestEcho01方法,假如没有创建即可,基于此方法演示慢调用过程下的限流：

     //AtomicLong 类支持线程安全的自增自减操作
    private AtomicLong atomicLong=new AtomicLong(1);
    @GetMapping("/consumer/doRestEcho1")
    public  String doRestEcho01() throws InterruptedException {
        //consumerService.doGetResource();
        //获取自增对象的值,然后再加1
        long num=atomicLong.getAndIncrement();
        if(num%2==0){//模拟50%的慢调用比例
           Thread.sleep(200);
        }
        String url="http://localhost:8081/provider/echo/"+server;
        //远程过程调用-RPC
        return restTemplate.getForObject(url,String.class);//String.class调用服务响应数据类型
    }

2.Sentinel降级操作

第一步：服务启动后，选择要降级的链路，如图：

第二步：选择要降级的链路，如图

注：这里表示熔断策略为慢调用比例，表示链路请求数超过3时，假如平均响应时间假如超过200毫秒的有50%，则对请求进行熔断，熔断时长为10秒钟，10秒以后恢复正常。

第三步：对指定链路进行刷新，多次访问测试，假如出现了降级熔断，会出现如下结果：

五、Sentinel异常处理

系统提供了默认的异常处理机制，假如默认处理机制不满足我们需求，我们可以自己进行定义。定义方式上可以直接或间接实现BlockExceptionHandler接口，并将对象交给spring管理。

在这里插入图片描述

@Component
public class ServiceBlockExceptionHandler implements BlockExceptionHandler {
    @Override
    public void handle(HttpServletRequest request, HttpServletResponse response,BlockException e) throws Exception {
         //response.setStatus(601);
         //设置响应数据的编码
         response.setCharacterEncoding("utf-8");
         //告诉客户端要响应的数据类型以及客户端以什么编码呈现数据
         response.setContentType("text/html;charset=utf-8");
         PrintWriter pw=response.getWriter();
         Map<String,Object> map=new HashMap<>();
         if(e instanceof DegradeException){//降级、熔断
             map.put("status",601);
             map.put("message", "服务被熔断了!");
         }else if(e instanceof FlowException){
             map.put("status",602);
             map.put("message", "服务被限流了!");
         }else{
             map.put("status",603);
             map.put("message", "Blocked by Sentinel (flow limiting)");
         }
         //将map对象转换为json格式字符串
         String jsonStr=new ObjectMapper().writeValueAsString(map);
         pw.println(jsonStr);
         pw.flush();
    }
}

六、Sentinel降级策略分析

Sentinel熔断降级支持慢调用比例、异常比例、异常数三种策略

1.慢调用比例

慢调用指耗时大于阈值RT（Response Time）的请求称为慢调用，阈值RT由用户设置。其属性具体含义说明如下：

在这里插入图片描述

慢调用逻辑中的状态分析如下：

熔断（OPEN）：请求数大于最小请求数并且慢调用的比率大于比例阈值则发生熔断，熔断时长为用户自定义设置。
探测（HALFOPEN）：当熔断过了定义的熔断时长，状态由熔断（OPEN）变为探测（HALFOPEN）。
关闭（CLOSED）：如果接下来的一个请求小于最大RT，说明慢调用已经恢复，结束熔断，状态由探测（HALF_OPEN）变更为关闭（CLOSED），如果接下来的一个请求大于最大RT，说明慢调用未恢复，继续熔断，熔断时长保持一致
注意：Sentinel默认统计的RT上限是4900ms，超出此阈值的都会算作4900ms，若需要变更此上限可以通过启动配置项-Dcsp.sentinel.statistic.max.rt=xxx来配置

2.异常比例

当资源的每秒请求数大于等于最小请求数，并且异常总数占通过量的比例超过比例阈值时，资源进入降级状态。

3.异常数量

当资源近1分钟的异常数目超过阈值（异常数）之后会进行服务降级。注意，由于统计时间窗口是分钟级别的，若熔断时长小于60s，则结束熔断状态后仍可能再次进入熔断状态。其属性说明如下：

在这里插入图片描述

七、Sentinel热点规则分析

1.概述

热点即为经常访问的数据，比如：

商品ID为参数，统计一段时间内最常购买的商品 ID 并进行限制。
用户ID为参数，针对一段时间内频繁访问的用户 ID 进行限制。

热点参数限流会统计传入参数中的热点数据，并根据配置的限流阈值与模式，对包含热点参数的资源调用进行限流。热点参数限流可以看做是一种特殊的流量控制，仅对包含热点参数的资源调用生效。其中，Sentinel会利用 LRU 策略统计最近最常访问的热点参数，结合令牌桶算法来进行参数级别的流控。

2.入门案例

第一步：定义热点业务代码

 //http://ip:port/consumer/doFindById?id=10
        @GetMapping("/consumer/findById")
        @SentinelResource("res")
        public String doFindById(@RequestParam("id") Integer id){
            return "resource id is "+id;
        }

第二步：服务启动后，选择要限流的热点链路，如图所示：

在这里插入图片描述

第三步：设置要限流的热点，如图所示：

在这里插入图片描述

注：热点规则的限流模式只有QPS模式（这才叫热点）。参数索引为@SentinelResource注解的方法参数下标，0代表第一个参数，1代表第二个参数。单机阈值以及统计窗口时长表示在此窗口时间超过阈值就限流。

第四步：多次访问热点参数方法，前端会出现如下界面

然后，在后台出现如下异常表示限流成功

com.alibaba.csp.sentinel.slots.block.flow.param.ParamFlowException: 2

3.特定参数设计

注：其中，热点参数其实说白了就是特殊的流控，流控设置是针对整个请求的；但是热点参数他可以设置到具体哪个参数，甚至参数针对的值，这样更灵活的进行流控管理。
一般应用在某些特殊资源的特殊处理，如：某些商品流量大，其他商品流量很正常，就可以利用热点参数限流的方案。配置参数例外项，如图所示：

这里表示参数值为5时阈值为100，其它参数值阈值为1，例如当我们访问http://ip:port/consumer/doRestEcho1?id=5时的限流阈值为100。

八、Sentinel系统规则

1.概述

系统在生产环境运行过程中，我们经常需要监控服务器的状态，看服务器CPU、内存、IO等的使用率；主要目的就是保证服务器正常的运行，不能被某些应用搞崩溃了；而且在保证稳定的前提下，保持系统的最大吞吐量。
长期以来，系统自适应保护的思路是根据硬指标，即系统的负载 (load1) 来做系统过载保护。当系统负载高于某个阈值，就禁止或者减少流量的进入；当 load 开始好转，则恢复流量的进入。

2.入门案例

Sentinel的系统保护规则是从应用级别的入口流量进行控制，从单台机器的总体 Load、RT、入口 QPS 、线程数和CPU使用率五个维度监控应用数据，让系统尽可能跑在最大吞吐量的同时保证系统整体的稳定性。如图所示：

Load（仅对 Linux/Unix-like 机器生效）：当系统 load1 超过阈值，且系统当前的并发线程数超过系统容量时才会触发系统保护。系统容量由系统的 maxQps * minRt 计算得出。设定参考值一般是 CPU cores * 2.5。
CPU使用率：当系统 CPU 使用率超过阈值即触发系统保护（取值范围 0.0-1.0）。
RT：当单台机器上所有入口流量的平均 RT 达到阈值即触发系统保护，单位是毫秒。
线程数：当单台机器上所有入口流量的并发线程数达到阈值即触发系统保护。
入口 QPS：当单台机器上所有入口流量的 QPS 达到阈值即触发系统保护。系统保护规则是应用整体维度的，而不是资源维度的，并且仅对入口流量生效。入口流量指的是进入应用的流量（EntryType.IN），比如 Web 服务。

九、Sentinel授权规则

1.概述

很多时候，我们需要根据调用方来限制资源是否通过，这时候可以使用 Sentinel 的黑白名单控制的功能。黑白名单根据资源的请求来源（origin）限制资源是否通过，若配置白名单则只有请求来源位于白名单内时才可通过；若配置黑名单则请求来源位于黑名单时不通过，其余的请求通过。例如微信中的黑名单。

2.入门案例

sentinel可以基于黑白名单方式进行授权规则设计

黑白名单规则（AuthorityRule）非常简单，主要有以下配置项：

资源名:即限流规则的作用对象
流控应用:对应的黑名单/白名单中设置的规则值,多个值用逗号隔开.
授权类型:白名单，黑名单(不允许访问).

3.案例实现

定义请求解析器,用于对请求进行解析,并返回解析结果,sentinel底层在拦截到用户请求以后,会对请求数据基于此对象进行解析,判定是否符合黑白名单规则

第一步：定义RequestOriginParser接口的实现类，基于业务在接口方法中解析请求数据并返回.

@Component
public class DefaultRequestOriginParser implements RequestOriginParser {
    @Override
    public String parseOrigin(HttpServletRequest request) {
        String origin = request.getParameter("origin");
        return origin;
    }
}

第二步：定义流控规则

在这里插入图片描述

第三步：执行资源访问,检测授权规则应用,当我们配置的流控应用值为app1时，假如规则为黑名单，则基于
http://ip:port/path?origin=app1的请求不可以通过,会出现如下结果:

在这里插入图片描述

第四步:设计过程分析，如图所示：

大小不少年

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
微服务（二）Sentinel限流熔断

目录一、Sentinel简介1.概述2.安装Sentinel服务3.访问Sentinel服务二、Sentinel限流入门1.概述2.sentinel集成实现3.sentinel限流入门案例三、Sentinel流控规则分析1.阈值类型分析2.设置限流模式2.1 直接模式2.2 关联模式2.3 链路模式3.设计限流效果3.1 快速失败3.2 WarmUp（预热）3.3 排队等待四、Sentinel降级入门1.概述2.Se...
复制链接

扫一扫