Alibaba Sentinel 限流、熔断实现详解

最新推荐文章于 2024-07-12 15:26:27 发布

置顶平菇虾饺

最新推荐文章于 2024-07-12 15:26:27 发布

阅读量1.6k

点赞数

分类专栏： Java 文章标签： Sentinel 令牌桶限流 WarnUp限流熔断限流预案

本文链接：https://blog.csdn.net/qyp199312/article/details/103703755

版权

Java 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

文章目录

前言
限流

前言

这篇文章是 Alibaba Sentinel熔断降级/限流框架不完全解析的附属文章。

讲的是其限流、熔断的实现。本文主要讲算法实现，跟Sentinel关系不大，无需对Sentinel加以了解

本文会辅以部分源码解析，源码在git 上: https://github.com/alibaba/Sentinel

限流

理解参阅文：https://www.cnblogs.com/taromilk/p/11877242.html

快速失败限流（普通限流 DefaultController）

快速失败很简单，超过了阈值就抛出异常。
主要依赖时间窗口。
对应实现类： com.alibaba.csp.sentinel.slots.block.flow.controller.DefaultController

原理主要需要了解滑动窗口。

滑动窗口

写了两页PPT，直接看图就好了：
滑动窗口设计
滑动窗口的滑动：

于是，当前定义时间段（秒级）就由秒级时间段的多个窗口的每个窗口的QPS之和累计即可

热加载限流（WarnUp）

一般会对比Guava的热加载限流，确实Sentinel的实现上有参考的影子，但是它自身的实现还是不一样的（可分别读两者，没必然关联）
这里的实现非常巧妙，纯阅读源码会被带坑里去，花了我好久的时间
参阅源码：com.alibaba.csp.sentinel.slots.block.flow.controller.WarmUpController

热加载用的是令牌桶的形式，其中一个牛逼的地方在于：

系统启动的时候能支持热加载；
系统运行中，如果有低负载期，也会有热加载流程

流量波动期

Sentinel的令牌桶主要参照令牌桶中的**剩余令牌数**概念，有这么几个重点：

令牌桶不能空，空了就没法取令牌了，需要有个警戒值
桶满的时候，为系统最低负载期（冷了很久，或者刚启动）
剩余令牌未到警戒值，系统处于热加载阶段，可以算当前时间点的令牌数
剩余令牌超过警戒值，系统热加载完毕，需要及时添加令牌保证桶不空

于是问题简化为判断当前剩余令牌数与警戒值的关系。
下面直接进行源码分析

Sentinel给令牌桶添加令牌（com.alibaba.csp.sentinel.slots.block.flow.controller.WarmUpController）：

    protected void syncToken(long passQps) {
        long currentTime = TimeUtil.currentTimeMillis();
        // 当前时间都是取整的
        currentTime = currentTime - currentTime % 1000;
        long oldLastFillTime = lastFilledTime.get();
        // 单位秒只添加一次令牌（同时意味着热加载时期， 单位秒的限流大小是固定的）
        if (currentTime <= oldLastFillTime) {
            return;
        }

        long oldValue = storedTokens.get();
        // 判断 添加多少个令牌 ↓↓↓
        long newValue = coolDownTokens(currentTime, passQps);

        // 为并发做准备
        if (storedTokens.compareAndSet(oldValue, newValue)) {
            // 当前剩余令牌数减去上一秒的令牌数， 然后再参与计算当前时间的令牌数（这个值在后续作为分母， 减掉部分之后分数才会变大）
            long currentValue = storedTokens.addAndGet(0 - passQps);
            if (currentValue < 0) {
                storedTokens.set(0L);
            }
            lastFilledTime.set(currentTime);
        }
    }

添加多少个令牌：

    private long coolDownTokens(long currentTime, long passQps) {
        long oldValue = storedTokens.get();
        // 大部分 热加载 时期， 这个值（剩余令牌数）就是下一秒参与计算的令牌数。
        long newValue = oldValue;

        // 剩余令牌数小于警戒值， 需要加令牌。
        if (oldValue < warningToken) {
            // 添加的个数就是  现在到上次添加令牌数的时间差， 每秒添加限流count个令牌。
            // 这儿的时间差好像没什么必要， 毕竟只要小于警戒值就会加。 每次消耗的量一定低于count数（大于了就不是限流了）
            newValue = (long)(oldValue + (currentTime - lastFilledTime.get()) * count / 1000);
        } else if (oldValue > warningToken) {
            // 这个地方的目的， 个人理解就是QPS过小的时候， 必须让它一直处于热加载期（一直添加， 就会一直大于警戒值）
            if (passQps < (int)count / coldFactor) {
                newValue = (long)(oldValue + (currentTime - lastFilledTime.get()) * count / 1000);
            }
        }
        // 大部分热加载时期， 初始剩余令牌数都会被一直减到达到热加载完毕为止。
        // 然后才会逐步添加
        return Math.min(newValue, maxToken);
    }

上述是Sentinel加令牌的策略，但是热加载时期，每个时刻限定的QPS还需要**单独算**。
这个跟上述加令牌的逻辑是独立的， 看各人的实现。

Sentinel的算法也很简单，热加载有这么几个初始值:

        // 限流数目
        this.count = count;
        // 冷加载因子， 这个值参与得到 警戒值和斜率 的计算， 固定值3
        this.coldFactor = coldFactor;
        // 警戒值， 限流大小 * 热加载时间 / 2。
        warningToken = (int)(warmUpPeriodInSec * count) / (coldFactor - 1);
        // 最大令牌数， 两倍于 警戒值
        maxToken = warningToken + (int)(2 * warmUpPeriodInSec * count / (1.0 + coldFactor));
        // 斜率
        slope = (coldFactor - 1.0) / count / (maxToken - warningToken);

获取当前时间点的可允许通过的QPS:

// 此处的aboveToken是 令牌桶中  剩余令牌数 比 警戒值 多的部分。  在热加载时期， 剩余令牌数  一直在减少。
long aboveToken = restToken - warningToken;

// 这个算当前可允许通过的QPS的算法， 是Sentinel家的实现， 没家都可以有自家的实现的。
// 例如Sentinel约定的初始值是 1/2 * count；
// 热加载期可允许通过的QPS有上一秒通过了的QPS的运算参与
Math.nextUp(1.0 / (aboveToken * slope + 1.0 / count));

排队限流（RateLimiterController）

一般会对比Guava的热加载限流，确实Sentinel的实现上有参考的影子，但是它自身的实现还是不一样的（可分别读两者，没必然关联）
这个的实现就简单易懂多了，直接源码解析。
参阅源码：com.alibaba.csp.sentinel.slots.block.flow.controller.RateLimiterController

排队限流原则：

QPS count 按秒切分为N个单位，每个单位：1000(ms) / count
每个单位只让一个QPS通过
通不过，预期时间能通过， sleep，就像漏桶一样屯着
通不过，预期时间通不过， fail
并发流量中每个并发都是可以参与到每个单位的抢占的。不过并发多了，可能导致限流不准。

排队限流的源码解析

    @Override
    public boolean canPass(Node node, int acquireCount, boolean prioritized) {
        // 默认值， 1
        if (acquireCount <= 0) {
            return true;
        }
        // 漏桶可以直接限成0
        if (count <= 0) {
            return false;
        }

        long currentTime = TimeUtil.currentTimeMillis();
        // 预计花费时间就是一个时间单位
        long costTime = Math.round(1.0 * (acquireCount) / count * 1000);

        // 预计结束时间就是上一个抢到令牌的流量的通过时间
        long expectedTime = costTime + latestPassedTime.get();

        if (expectedTime <= currentTime) {
            // 预计结束时间小于当前时间， 当然直接放流。 同时设定通过时间。
            latestPassedTime.set(currentTime);
            return true;
        } else {
            // 计算可能会等待的时间
            long waitTime = costTime + latestPassedTime.get() - TimeUtil.currentTimeMillis();
            // 预计等待时间比最大可等待时间都长， 直接失败。
            if (waitTime > maxQueueingTimeMs) {
                return false;
            } else {
                // 尝试抢占下一个窗口
                // 这里每个线程都会来抢占， 但无关先后顺序
                // 每个线程都能给这个值加一笔
                long oldTime = latestPassedTime.addAndGet(costTime);
                try {
                    // 得到抢占后的时间（可能是好多并发时间一起的）与当前时间的时间差。 如果这个时间差还比预计等待时间差大
                    // 也就是说现在的QPS超量了， 需要放弃。
                    waitTime = oldTime - TimeUtil.currentTimeMillis();
                    if (waitTime > maxQueueingTimeMs) {
                        // 既然当前这份流量不参与累计， 自然不能对后续通过时间做累加。
                        // 这样可能存在一定情况的并发问题， 特别是 最大等待时间比较小， 且并发还不小的情况下， 限流肯定不准。
                        latestPassedTime.addAndGet(-costTime);
                        return false;
                    }
                    // 如果满足条件， 就sleep 到预计等待时间那儿去， 然后获得令牌。
                    if (waitTime > 0) {
                        Thread.sleep(waitTime);
                    }
                    return true;
                } catch (InterruptedException e) {
                }
            }
        }
        return false;
    }

排队限流

平菇虾饺

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Alibaba Sentinel 限流、熔断实现详解

文章目录前言限流快速失败限流（普通限流）滑动窗口热加载限流（WarnUp）前言这篇文章是 Alibaba Sentinel熔断降级/限流框架不完全解析的附属文章。讲的是其限流、熔断的实现。本文主要讲算法实现，跟Sentinel关系不大，无需对Sentinel加以了解本文会辅以部分源码解析，源码在git 上: https://github.com/alibaba/Sentinel...
复制链接

扫一扫

专栏目录