Disruptor框架简述以及重复消费问题处理

1.什么是Disruptor

Martin Fowler在自己网站上写了一篇LMAX架构的文章,在文章中他介绍了LMAX是一种新型零售金融交易平台,它能够以很低的延迟产生大量交易。这个系统是建立在JVM平台上,其核心是一个业务逻辑处理器,它能够在一个线程里每秒处理6百万订单。业务逻辑处理器完全是运行在内存中,使`用事件源驱动方式。业务逻辑处理器的核心是Disruptor。

Disruptor它是一个开源的并发框架,并获得2011 Duke’s 程序框架创新奖,能够在无锁的情况下实现网络的Queue并发操作。

Disruptor是一个高性能的异步处理框架,或者可以认为是最快的消息框架(轻量的JMS),也可以认为是一个观察者模式的实现,或者事件监听模式的实现。

 

在使用之前,首先说明disruptor主要功能加以说明,你可以理解为他是一种高效的"生产者-消费者"模型。也就性能远远高于传统的BlockingQueue容器。

 

在JDK的多线程与并发库一文中, 提到了BlockingQueue实现了生产者-消费者模型

BlockingQueue是基于锁实现的, 而锁的效率通常较低. 有没有使用CAS机制实现的生产者-消费者

Disruptor就是这样.

Disruptor使用观察者模式, 主动将消息发送给消费者, 而不是等消费者从队列中取; 在无锁的情况下, 实现queue(环形, RingBuffer)的并发操作, 性能远高于BlockingQueue

2.Disruptor的设计方案

Disruptor通过以下设计来解决队列速度慢的问题:

环形数组结构

为了避免垃圾回收,采用数组而非链表。同时,数组对处理器的缓存机制更加友好。

元素位置定位

数组长度2^n,通过位运算,加快定位的速度。下标采取递增的形式。不用担心index溢出的问题。index是long类型,即使100万QPS的处理速度,也需要30万年才能用完。

无锁设计

每个生产者或者消费者线程,会先申请可以操作的元素在数组中的位置,申请到之后,直接在该位置写入或者读取数据。

下面忽略数组的环形结构,介绍一下如何实现无锁设计。整个过程通过原子变量CAS,保证操作的线程安全。

 

3.Disruptor的实现特征

另一个关键的实现低延迟的细节就是在Disruptor中利用无锁的算法,所有内存的可见性和正确性都是利用内存屏障或者CAS操作。使用CAS来保证多线程安全,与大部分并发队列使用的锁相比,CAS显然要快很多。CAS是CPU级别的指令,更加轻量,不必像锁一样需要操作系统提供支持,所以每次调用不需要在用户态与内核态之间切换,也不需要上下文切换。

只有一个用例中锁是必须的,那就是BlockingWaitStrategy(阻塞等待策略),唯一的实现方法就是使用Condition实现消费者在新事件到来前等待。许多低延迟系统使用忙等待去避免Condition的抖动,然而在系统忙等待的操作中,性能可能会显著降低,尤其是在CPU资源严重受限的情况下,例如虚拟环境下的WEB服务器。

 

3.实现生产与消费

3.1引入pom依赖

   <dependency>
            <groupId>com.lmax</groupId>
            <artifactId>disruptor</artifactId>
            <version>3.2.1</version>
        </dependency>

 

3.2首先声明一个Event来包含需要传递的数据

package com.ywj.disruptor.controller;

/**
 * @ClassName DisruptorTest01
 * @Author ywj
 * @Describe 生产者和消费者传递数据的事件(类型)
 * @Date 2020/3/31 10:41
 */
public class DisruptorEvent {


    private Long value;

    public Long getValue() {
        return value;
    }

    public void setValue(Long value) {
        this.value = value;
    }
}

3.2需要让Disruptor为我们创建事件,我们同时还声明了一个EventFactory来实例化Event对象

package com.ywj.disruptor.controller;

import com.lmax.disruptor.EventFactory;

/**
 * @ClassName DisruptorEventFactory
 * @Author ywj
 * @Describe 需要让Disruptor为我们创建事件,我们同时还声明了一个EventFactory来实例化Event对象。
 * @Date 2020/4/3 16:06
 */
public class DisruptorEventFactory implements EventFactory<DisruptorEvent> {


    @Override
    public DisruptorEvent newInstance() {
        return new DisruptorEvent();
    }
}

3.3事件消费者,也就是一个事件处理器。这个事件处理器简单地把事件中存储的数据打印到终端:

package com.ywj.disruptor.controller;


import com.lmax.disruptor.EventHandler;

/**
 * @ClassName DisruptorEventHandler
 * @Author ywj
 * @Describe  消费者
 * @Date 2020/4/3 16:08
 */
public class DisruptorEventHandler implements EventHandler<DisruptorEvent> {

    private String id;

    public DisruptorEventHandler(String id) {
        this.id = id;
    }

    @Override
    public void onEvent(DisruptorEvent event, long l, boolean b) throws Exception {
        System.out.println("消费者:"+"id:"+this.id+"  "+event.getValue());
    }
}

3.4定义生产者

package com.ywj.disruptor.controller;

import com.lmax.disruptor.RingBuffer;

import java.nio.ByteBuffer;

/**
 * @ClassName DisruptorEventProducer
 * @Author ywj
 * @Describe  生产者
 * @Date 2020/4/7 9:55
 */
public class DisruptorEventProducer   {


    public final RingBuffer<DisruptorEvent> ringBuffer;

    public DisruptorEventProducer(RingBuffer<DisruptorEvent> ringBuffer) {
        this.ringBuffer = ringBuffer;
    }


    public void onData(ByteBuffer byteBuffer) {
        // 1.ringBuffer 事件队列 下一个槽
        long sequence = ringBuffer.next();
        Long data = null;
        try {
            //2.取出空的事件队列
            DisruptorEvent disruptorEvent = ringBuffer.get(sequence);
            data = byteBuffer.getLong(0);
            //3.获取事件队列传递的数据
            disruptorEvent.setValue(data);
            try {
                Thread.sleep(10);
            } catch (InterruptedException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
        } finally {
            System.out.println("生产这准备发送数据");
            //4.发布事件
            ringBuffer.publish(sequence);

        }
    }





}

3.5调用测试

package com.ywj.disruptor.controller;

import com.lmax.disruptor.EventFactory;
import com.lmax.disruptor.RingBuffer;
import com.lmax.disruptor.dsl.Disruptor;
import com.lmax.disruptor.dsl.EventHandlerGroup;
import sun.applet.Main;

import java.nio.ByteBuffer;
import java.util.concurrent.Executor;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledThreadPoolExecutor;

/**
 * @ClassName DisruptorMain
 * @Author ywj
 * @Describe
 * @Date 2020/4/7 14:22
 */
public class DisruptorTest {


    public static void main(String[] args) {
        //最佳线程数目 = ((线程等待时间+线程CPU时间)/线程CPU时间 )* CPU数目
        //非阻塞型取cpu核数
        ScheduledThreadPoolExecutor poolExecutor = new ScheduledThreadPoolExecutor(12);
        //构建工厂对象
        EventFactory<DisruptorEvent> disruptorEventFactory = new DisruptorEventFactory();
        //ringbuffer大小 是2的N次方
        int ringbuffer = 1024 * 1024;
        //创建event对象 工厂   ringbuffer长度   线程池
        Disruptor<DisruptorEvent> eventDisruptor = new Disruptor<DisruptorEvent>(disruptorEventFactory, ringbuffer, poolExecutor);
        //连接消费者----注册消费者

         eventDisruptor.handleEventsWith(new DisruptorEventHandler("1"));
 
          //多个消费者但是会重复消费
//        DisruptorEventHandler[] disruptorEventHandlers = new DisruptorEventHandler[2];
//        disruptorEventHandlers[0] = new DisruptorEventHandler("1");
//        disruptorEventHandlers[1] = new DisruptorEventHandler("2");
//        eventDisruptor.handleEventsWith(disruptorEventHandlers);


        //启动
        eventDisruptor.start();
        //创建一个ringbuffer
        RingBuffer<DisruptorEvent> ringBuffer = eventDisruptor.getRingBuffer();
        //创建生产者
        DisruptorEventProducer eventProducer = new DisruptorEventProducer(ringBuffer);
        //分配缓冲区大小为8
        ByteBuffer byteBuffer = ByteBuffer.allocate(8);

        for (int i = 0; i < 100; i++) {
            byteBuffer.putLong(0, i);
            eventProducer.onData(byteBuffer);
        }
        eventDisruptor.shutdown();
    }
}

4.Disruptor实现竞争消费(多个消费者不重复消费)

这里就需要讲到handleEventsWithhandleEventsWithWorkerPool方法的区别

常用的方法是:disruptor.handleEventsWith(EventHandler ... handlers),将多个EventHandler的实现类传入方法,封装成一个EventHandlerGroup,实现多消费者消费。

disruptor的另一个方法是:disruptor.handleEventsWithWorkerPool(WorkHandler ... handlers),将多个WorkHandler的实现类传入方法,封装成一个EventHandlerGroup实现多消费者消费。

两者共同点都是,将多个消费者封装到一起,供框架消费消息。

不同点在于

1. 对于某一条消息m,handleEventsWith方法返回的EventHandlerGroup,Group中的每个消费者都会对m进行消费,各个消费者之间不存在竞争。handleEventsWithWorkerPool方法返回的EventHandlerGroup,Group的消费者对于同一条消息m不重复消费;也就是,如果c0消费了消息m,则c1不再消费消息m。

2. 传入的形参不同。对于独立消费的消费者,应当实现EventHandler接口。对于不重复消费的消费者,应当实现WorkHandler接口。

因此,根据消费者集合是否独立消费消息,可以对不同的接口进行实现。也可以对两种接口同时实现,具体消费流程由disruptor的方法调用决定。

下面是实现代码

package com.ywj.disruptor.controller;


import com.lmax.disruptor.EventHandler;
import com.lmax.disruptor.WorkHandler;

/**
 * @ClassName DisruptorEventHandler
 * @Author ywj
 * @Describe  消费者  不会重复消费
 * @Date 2020/4/3 16:08
 */
public class DisruptorEventHandler2 implements WorkHandler<DisruptorEvent> {

    private String id;

    public DisruptorEventHandler2(String id) {
        this.id = id;
    }

    @Override
    public void onEvent(DisruptorEvent event) throws Exception {
        System.out.println("消费者2:"+"id:"+this.id+"  "+event.getValue());
    }
}

 

测试消费代码

package com.ywj.disruptor.controller;

import com.lmax.disruptor.EventFactory;
import com.lmax.disruptor.RingBuffer;
import com.lmax.disruptor.dsl.Disruptor;
import com.lmax.disruptor.dsl.EventHandlerGroup;
import sun.applet.Main;

import java.nio.ByteBuffer;
import java.util.concurrent.Executor;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledThreadPoolExecutor;

/**
 * @ClassName DisruptorMain
 * @Author ywj
 * @Describe
 * @Date 2020/4/7 14:22
 */
public class DisruptorTest {


    public static void main(String[] args) {
        //最佳线程数目 = ((线程等待时间+线程CPU时间)/线程CPU时间 )* CPU数目
        //非阻塞型取cpu核数
        ScheduledThreadPoolExecutor poolExecutor = new ScheduledThreadPoolExecutor(12);
        //构建工厂对象
        EventFactory<DisruptorEvent> disruptorEventFactory = new DisruptorEventFactory();
        //ringbuffer大小 是2的N次方
        int ringbuffer = 1024 * 1024;
        //创建event对象 工厂   ringbuffer长度   线程池
        Disruptor<DisruptorEvent> eventDisruptor = new Disruptor<DisruptorEvent>(disruptorEventFactory, ringbuffer, poolExecutor);
        //连接消费者----注册消费者

        //多个消费者不重复吧消费
        DisruptorEventHandler2[] disruptorEventHandlers = new DisruptorEventHandler2[2];
        disruptorEventHandlers[0] = new DisruptorEventHandler2("1");
        disruptorEventHandlers[1] = new DisruptorEventHandler2("2");
        eventDisruptor.handleEventsWithWorkerPool(disruptorEventHandlers);


        //多个消费者还是会产生数据重复
        DisruptorEventHandler[] disruptorEventHandlers2 = new DisruptorEventHandler[2];
        disruptorEventHandlers2[0] = new DisruptorEventHandler("1");
        disruptorEventHandlers2[1] = new DisruptorEventHandler("2");
        eventDisruptor.handleEventsWith(disruptorEventHandlers2);


        //启动
        eventDisruptor.start();
        //创建一个ringbuffer
        RingBuffer<DisruptorEvent> ringBuffer = eventDisruptor.getRingBuffer();
        //创建生产者
        DisruptorEventProducer eventProducer = new DisruptorEventProducer(ringBuffer);
        //分配缓冲区大小为8
        ByteBuffer byteBuffer = ByteBuffer.allocate(8);

        for (int i = 0; i < 100; i++) {
            byteBuffer.putLong(0, i);
            eventProducer.onData(byteBuffer);
        }
        eventDisruptor.shutdown();
    }
}

 

5.什么是ringBuffer

 

它是一个环(首尾相接的环),你可以把它用做在不同上下文(线程)间传递数据的buffer。

 

基本来说,ringbuffer拥有一个序号,这个序号指向数组中下一个可用的元素。(校对注:如下图右边的图片表示序号,这个序号指向数组的索引4的位置。)

随着你不停地填充这个buffer(可能也会有相应的读取),这个序号会一直增长,直到绕过这个环。

 

http://ifeve.com/wp-content/uploads/2013/01/RingBufferWrapped.png

要找到数组中当前序号指向的元素,可以通过mod操作:

以上面的ringbuffer为例(java的mod语法):12 % 10 = 2。很简单吧。  事实上,上图中的ringbuffer只有10个槽完全是个意外。如果槽的个数是2的N次方更有利于基于二进制

5.1ringbuffer的优点

之所以ringbuffer采用这种数据结构,是因为它在可靠消息传递方面有很好的性能。这就够了,不过它还有一些其他的优点。

首先,因为它是数组,所以要比链表快,而且有一个容易预测的访问模式。(译者注:数组内元素的内存地址的连续性存储的)。这是对CPU缓存友好的—也就是说,在硬件级别,数组中的元素是会被预加载的,因此在ringbuffer当中,cpu无需时不时去主存加载数组中的下一个元素。(校对注:因为只要一个元素被加载到缓存行,其他相邻的几个元素也会被加载进同一个缓存行)

其次,你可以为数组预先分配内存,使得数组对象一直存在(除非程序终止)。这就意味着不需要花大量的时间用于垃圾回收。此外,不像链表那样,需要为每一个添加到其上面的对象创造节点对象—对应的,当删除节点时,需要执行相应的内存清理操作。

5.2RingBuffer底层实现

RingBuffer是一个首尾相连的环形数组,所谓首尾相连,是指当RingBuffer上的指针越过数组是上界后,继续从数组头开始遍历。因此,RingBuffer中至少有一个指针,来表示RingBuffer中的操作位置。另外,指针的自增操作需要做并发控制,Disruptor和本文的OptimizedQueue都使用CAS的乐观并发控制来保证指针自增的原子性,关于乐观并发控制之后会着重介绍。

 

Disruptor中的RingBuffer上只有一个指针,表示当前RingBuffer上消息写到了哪里,此外,每个消费者会维护一个sequence表示自己在RingBuffer上读到哪里,从这个角度讲,Disruptor中的RingBuffer上实际有消费者数+1个指针。由于我们要实现的是一个单消息单消费的阻塞队列,只要维护一个读指针(对应消费者)和一个写指针(对应生产者)即可,无论哪个指针,每次读写操作后都自增一次,一旦越界,即从数组头开始继续读写

 

 

6.Disruptor的核心概念

6.1RingBuffer

如其名,环形的缓冲区。曾经 RingBuffer 是 Disruptor 中的最主要的对象,但从3.0版本开始,其职责被简化为仅仅负责对通过 Disruptor 进行交换的数据(事件)进行存储和更新。在一些更高级的应用场景中,Ring Buffer 可以由用户的自定义实现来完全替代。

6.2SequenceDisruptor

通过顺序递增的序号来编号管理通过其进行交换的数据(事件),对数据(事件)的处理过程总是沿着序号逐个递增处理。一个 Sequence 用于跟踪标识某个特定的事件处理者( RingBuffer/Consumer )的处理进度。虽然一个 AtomicLong 也可以用于标识进度,但定义 Sequence 来负责该问题还有另一个目的,那就是防止不同的 Sequence 之间的CPU缓存伪共享(Flase Sharing)问题。(注:这是 Disruptor 实现高性能的关键点之一,网上关于伪共享问题的介绍已经汗牛充栋,在此不再赘述)。

Sequencer

Sequencer 是 Disruptor 的真正核心。此接口有两个实现类 SingleProducerSequencer、MultiProducerSequencer ,它们定义在生产者和消费者之间快速、正确地传递数据的并发算法。

 

6.3Sequence Barrier

用于保持对RingBuffer的 main published Sequence 和Consumer依赖的其它Consumer的 Sequence 的引用。 Sequence Barrier 还定义了决定 Consumer 是否还有可处理的事件的逻辑。

6.4Wait Strategy

定义 Consumer 如何进行等待下一个事件的策略。 (注:Disruptor 定义了多种不同的策略,针对不同的场景,提供了不一样的性能表现)

6.5Event

在 Disruptor 的语义中,生产者和消费者之间进行交换的数据被称为事件(Event)。它不是一个被 Disruptor 定义的特定类型,而是由 Disruptor 的使用者定义并指定。

6.6EventProcessor

EventProcessor 持有特定消费者(Consumer)的 Sequence,并提供用于调用事件处理实现的事件循环(Event Loop)。

6.7EventHandler

Disruptor 定义的事件处理接口,由用户实现,用于处理事件,是 Consumer 的真正实现。

6.8Producer

即生产者,只是泛指调用 Disruptor 发布事件的用户代码,Disruptor 没有定义特定接口或类型。

RingBuffer——Disruptor底层数据结构实现,核心类,是线程间交换数据的中转地;

Sequencer——序号管理器,负责消费者/生产者各自序号、序号栅栏的管理和协调;

Sequence——序号,声明一个序号,用于跟踪ringbuffer中任务的变化和消费者的消费情况;

SequenceBarrier——序号栅栏,管理和协调生产者的游标序号和各个消费者的序号,确保生产者不会覆盖消费者未来得及处理的消息,确保存在依赖的消费者之间能够按照正确的顺序处理;

EventProcessor——事件处理器,监听RingBuffer的事件,并消费可用事件,从RingBuffer读取的事件会交由实际的生产者实现类来消费;它会一直侦听下一个可用的序号,直到该序号对应的事件已经准备好。

EventHandler——业务处理器,是实际消费者的接口,完成具体的业务逻辑实现,第三方实现该接口;代表着消费者。

Producer——生产者接口,第三方线程充当该角色,producer向RingBuffer写入事件。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《生产者与消费问题算法实现》 设计思想 因为有多个缓冲区,所以生产者线程没有必要在生成新的数据之前等待最后一个数据被消费者线程处理完毕。同样,消费者线程并不一定每次只能处理一个数据。在多缓冲区机制下,线程之间不必互相等待形成死锁,因而提高了效率。   多个缓冲区就好像使用一条传送带替代托架,传送带上一次可以放多个产品。生产者在缓冲区尾加入数据,而消费者则在缓冲区头读取数据。当缓冲区满的时候,缓冲区就上锁并等待消费者线程读取数据;每一个生产或消费动作使得传送带向前移动一个单位,因而,消费者线程读取数据的顺序和数据产生顺序是相同的。 可以引入一个count计数器来表示已经被使用的缓冲区数量。用hNotEmptyEvent 和hNotFullEvent 来同步生产者和消费者线程。每当生产者线程发现缓冲区满( count=BufferSize ),它就等待hNotEmptyEvent 事件。同样,当消费者线程发现缓冲区空,它就开始等待hNotEmptyEvent。生产者线程写入一个新的数据之后,就立刻发出hNotEmptyEvent 来唤醒正在等待的消费者线程;消费者线程在读取一个数据之后,就发出hNotFullEvent 来唤醒正在等待的生产者线程。 程序的设计思想大致为:设置一while循环,pi生产者访问临界区,得到权限访问缓冲区,如果缓冲区满的,则等待,直到缓冲区非满;访问互斥锁,当得到互斥锁且缓冲区非满时,跳出while循环,开始产生新数据,并把数据存放于Buffer缓冲区中,当数据存放结束则结束临界区;接着唤醒消费者线程;ci消费者访问临界区,得到权限访问缓冲区,如果缓冲区为空,没有可以处理的数据,则释放互斥锁且等待,直到缓冲区非空;当等到缓冲区非空时,跳出while循环;消费者获得数据,并根据所获得的数据按类别消费(当消费者获得的数据为大写字母时,则把大写字母转换成小写字母,并显示;当消费者获得的数据为小写字母时,则把小写字母转换成大写字母,并显示;当消费者获得的数据为字符0、1、2、……8、9时,把这些字符直接显示到屏幕;当消费者获得的数据为符号(+、-、*、\……)时,把这些符号打印成7行7列的菱形);处理完数据后,结束临界区;接着唤醒生产者线程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值