13、Broker CommitLogDispatcher 异步构建ConsumeQueue和IndexFile源码解析

1、CommitLogDispatcherBuildConsumeQueue构建ConsumeQueue
CommitLogDispatcherBuildConsumeQueue用于接收分发请求并构建ConsumeQueue。
对于非事务消息或者是事务commit消息,则调用DefaultMessageStore#putMessagePositionInfo方法写入消息位置信息到consumeQueue,如果是事务prepared消息或者是事务rollback消息,则不进行处理。
    1.1 putMessagePositionInfo写入消息位置信息
        该方法首先调用findConsumeQueue方法根据topic和队列id确定需要写入的ConsumeQueue。然后调用ConsumeQueue#putMessagePositionInfoWrapper方法将消息信息追加到ConsumeQueue索引文件中。
    1.2 findConsumeQueue查找ConsumeQueue
        该方法根据topic和队列id确定需要写入的ConsumeQueue,查找的目标就是consumeQueueTable缓存集合。还可以知道,ConsumeQueue文件是延迟创建的,即当需要到该ConsumeQueue的时候才会新建。
        1.2.1 创建ConsumeQueue
            创建ConsumeQueue的构造器方法如下,将会初始化各种属性,然后会初始化20个字节的堆外内存,用于临时存储单个索引,这段内存可循环使用。
            ConsumeQueue文件可以看成是基于topic的commitlog索引文件,故ConsumeQueue文件夹的组织方式如下:topic/queue/file三层组织结构,具体存储路径为:$HOME/store/consumequeue/{topic}/{queueId}/{fileName}。
            例如topic名为TopicTest,并且有四个队列,则该topic的ConsumeQueue的组织方式为:


    1.3 putMessagePositionInfoWrapper追加消息索引
        该方法用于构建消息索引信息并且存入找到的ConsumeQueue文件中。支持重试,最大重试30次。
        1.3.1 putMessagePositionInfo写入消息位置信息
            该方法将消息位置信息写入到ConsumeQueue文件中。大概步骤为:
            1、校验如果消息偏移量+消息大小 小于等于ConsumeQueue已处理的最大物理偏移量。说明该消息已经被写过了,直接返回true。
            2、将消息信息offset、size、tagsCode按照顺序存入临时缓冲区byteBufferIndex中。
            3、调用getLastMappedFile方法,根据偏移量获取将要写入的最新ConsumeQueue文件的MappedFile,可能会新建ConsumeQueue文件。getLastMappedFile方法的源码我们此前学过了。
            4、进行一系列校验,例如是否需要重设索引信息,是否存在写入错误等等。
            5、更新消息最大物理偏移量maxPhysicOffset = 消息在CommitLog中的物理偏移量 + 消息的大小。
            6、调用MappedFile#appendMessage方法将临时缓冲区中的索引信息追加到mappedFile的mappedByteBuffer中,并且更新wrotePosition的位置信息,到此构建ComsumeQueue完毕。
            从该方法中我们可以知道一条消息在ConsumeQueue中的一个索引条目的存储方式,固定为8B的offset+4B的size+8BtagsCode,固定占用20B。
            1、offset,消息在CommitLog中的物理偏移量。
            2、size,消息大小。
            3、tagsCode,延迟消息就是消息投递时间,其他消息就是消息的tags的hashCode。
            
            1.3.1.1 MappedFile#appendMessage追加消息
                该方法用于将数据追加到MappedFile,这里仅仅是追加到对应的mappedByteBuffer中,基于mmap技术仅仅是将数据写入pageCache中,并没有立即刷盘,而是依靠操作系统判断刷盘,这样保证了写入的高性能。

2、CommitLogDispatcherBuildIndex构建IndexFile
CommitLogDispatcherBuildIndex用于接收分发请求并构建IndexFile。
首先判断是否支持消息Index,默认是支持的,那么调用IndexService#buildIndex方法构建。如果不存在则不构建,因此Index文件是否存在都不影响RocketMQ的正常运行,它进被用来提升根据keys或者时间范围查询消息的效率。
    2.1 buildIndex构建Index索引
    该方法用于为一条消息构建Index索引,大概步骤为:
        1、通过retryGetAndCreateIndexFile方法获取或创建最新索引文件IndexFile,支持重试最多3次。
        2、判断当前消息在commitlog中的偏移量小于该文件的结束索引在commitlog中的偏移量,那么表示已为该消息构建Index索引,直接返回。如果该消息是事务回滚消息,则同样直接返回,不需要创建索引。
        3、获取客户端生成的uniqId,也被称为msgId,从逻辑上代表客户端生成的唯一一条消息,如果uniqId不为null,那么调用putKey方法为uniqId构建索引。
        4、获取客户端传递的keys,如果keys不为空,那么调用putKey方法为keys中的每一个key构建索引。
        
        2.1.1、retryGetAndCreateIndexFile获取IndexFile
            该方法用于获取或创建索引文件,支持重试。方法中开启了一个循环,最多循环三次,在循环中调用getAndCreateLastIndexFile方法获取最新的索引文件,如果文件写满了或者还没有文件则会自动创建新的索引文件。
            
            2.1.1.1 getAndCreateLastIndexFile获取最新IndexFile
                该方法尝试获取最新的索引文件,如果文件写满了或者还没有文件则会自动创建新的索引文件。大概步骤为:
                1、首先获取读锁。
                    1、如果indexFileList不为空,那么尝试获取最后一个IndexFile,否则创建一个新的,比如第一次写。
                    2、如果最后一个IndexFile没写满,则赋值给indexFile,后面直接返回。
                    3、如果最后一个IndexFile写满了,则创建新文件,获取目前最后一个文件的endPhyOffset,获取目前最后一个文件的endTimestamp等信息。
                    4、释放读锁。
                2、如果上一步没有获取到indexFile,那么尝试创建一个新的IndexFile。
                    1、获取完整文件名$HOME/store/index${fileName},fileName是以创建时的时间戳命名的,精确到毫秒,例如20220512214613292。
                    2、调用IndexFile的构造器创建新的IndexFile。
                    3、获取写锁。将新建的IndexFile加入到indexFileList集合尾部。释放写锁。
                    4、创建了新的文件之后,那么尝试将上一个文件刷盘。新开一个线程,异步的调用IndexService#flush方法对上一个IndexFile文件刷盘。
                3、最后返回获取的indexFile。
                可以看到,这里尝试获取的是最新的IndexService,并且引入了读写锁的设计。在获取indexFileList的最后一个元素时使用读锁,而在创建了indexFile之后向indexFileList添加indexFile的时候使用写锁。使用读写锁的好处很明显,既保证了数据安全,同时保证了效率的最大化,因为Index文件的使用永远都是查询远远大于创建的。
                
                2.1.1.1.1 创建IndexFile
                    当第一次构建Index或者之前的IndexFile写满了的时候,需要通过IndexFile的构造器创建新的IndexFile。
                    Index文件的存储位置是:$HOME/store/index${fileName},文件名fileName是以创建时的时间戳命名的,固定的单个IndexFile文件大小约为:40B 头数据indexHeader + 500w * 4B hashslot + 2000w * 20B index = 420000040B,约为400M。
        
        2.1.2 buildKey构建Key
            该方法构建Index索引的key。RocketMQ将会为uniqId和keys中的每个key构建索引,但是并不是直接以这两个参数作为key的,而是通过buildKey方法进行了处理。
            UniqKey将会转换为topic#UniqKey,而keys则会先通过空格拆分,然后将每个key转换为topic#key,然后才会构建索引。
            也就是说,IndexFile支持通过Topic以及UNIQ_KEY或者KEYS来查询消息。

        2.1.3 putKey构建Index索引
            IndexFile文件的存储位置是:$HOME\store\index${fileName},文件名fileName是以创建时的时间戳命名的,文件大小是固定的,等于40+500W*4+2000W*20= 420000040个字节大小。即一个IndexFile可以保存2000W个索引,IndexFile的底层存储设计为在文件系统中实现HashMap结构,故rocketmq的索引文件其底层实现为hash索引。
            putKey方法就是构建Index索引的入口方法,该方法将会循环调用indexFile#putKey方法构建Index索引,知道成功,而每次构建失败都将调用retryGetAndCreateIndexFile方法尝试获取或创建最新索引文件然后再尝试构建。
            
            2.1.3.1 IndexFile#putKey构建Index索引
            该方法用于构建Index索引,大概步骤为:
                1、判断如果当前文件的index索引数量小于2000w,则表明当前文件还可以继续构建索引,。
                2、计算Key的哈希值keyHash,通过 哈希值keyHash & hash槽数量hashSlotNum(默认5000w) 的方式获取当前key对应的hash槽下标位置slotPos。然后计算该消息的绝对hash槽偏移量 absSlotPos = 40B + slotPos * 4B。
                3、计算当前消息在commitlog中的消息存储时间与该Index文件起始时间差timeDiff。计算该消息的索引存放位置的绝对偏移量absIndexPos = 40B + 500w * 4B + indexCount * 20B。
                4、在absIndexPos位置顺序存放Index索引数据,共计20B。存入4B的当前消息的Key的哈希值,存入8B的当前消息在commitlog中的物理偏移量,存入4B的当前消息在commitlog中的消息存储时间与该Index文件起始时间差,存入4B的slotValue,即前面读出来的 slotValue,可更新当前hash槽的值为最新的IndexFile的索引条目计数的编号,也就是当前索引存入的编号能是0,也可能不是0,而是上一个发送hash冲突的索引条目的编号。
                5、在absSlotPos位置更新当前hash槽的值为最新的IndexFile的索引条目计数的编号,也就是当前索引存入的编号。从存入的数据可以看出来:IndexFile采用用slotValue字段将所有冲突的索引用链表的方式串起来了,而哈希槽SlotTable并不保存真正的索引数据,而是保存每个槽位对应的单向链表的头,即可以看作是头插法插入数据。
                6、判断如果索引数量小于等于1,说明时该文件第一次存入索引,那么初始化beginPhyOffset和beginTimestamp。
                7、继续判断如果slotValue为0,那么表示采用了一个新的哈希槽,此时hashSlotCount自增1。
                8、因为存入了新的索引,那么索引条目计数indexCount自增1,设置新的endPhyOffset和endTimestamp。
3 IndexFile小结
学习了上面的源码,我们总结一下。

image.png
IndexFile的构成包括40B的Header头信息,4*500wB的Slot信息,20*2000wB的Index信息,具体解释为:

1、文件前40个字节存放头信息,在Java中被表示为IndexHeader,存放着一些统计信息,按顺序包括:
    1、8B的beginTimestamp,该索引文件存储的第一条索引对应的消息在commitlog中的消息存储时间。
    2、8B的endTimestamp,该索引文件存储的最后一条索引对应的消息在commitlog中的消息存储时间。
    3、8B的beginPhyOffset,该索引文件存储的第一条索引对应的消息在commitlog中的物理偏移量。
    4、8B的endPhyOffset,该索引文件存储的最后一条索引对应的消息在commitlog中的物理偏移量。
    5、4B的hashSlotCount,哈希槽计数。
    6、4B的indexCount,索引条目计数+1。
2、文件第二部分存储4*500wB的Hash Slot信息,slot Table并不保存真正的索引数据,而是保存每个槽位对应的单向链表的头。即存储的是当前位置的最新消息的索引条目计数的编号indexCount。
3、文件第三部分存储20*2000wB的Index信息,这才是真正的索引信息,按顺序包括:
    1、4B的Key Hash,当前消息的Key的哈希值。
    2、8B的CommitLog Offset,当前消息在commitlog中的物理偏移量。
    3、4B的Timestamp,当前消息在commitlog中的消息存储时间与该Index文件起始时间差。
    4、4B的NextIndex offset,即前面读出来的 slotValue,可能是0,也可能不是0,而是上一个发生hash冲突的索引条目的编号,或者说链表的下一个索引的Index位置。
上面描述的是Index索引的物理存储结构,注意一个消息的slot位置是根据哈希值计算出来的,而具体的索引条目是按照顺序存储的。
我们之前说过Index索引在逻辑上是一个哈希表的实现,采用链表来解决hash冲突,这里该怎么理解呢?
假设一个消息A,根据hash值计算出的slot位置为240,这个位置是一个新位置,此前没有被使用过。那么其值默认为0,假设此时的indexCount为100,那么存储的新索引条目的最后NextIndex offset =0,随后将该位置的slot置为indexCount,即100。
后来一个新的消息B,根据hash值计算出的slot位置也是240,这个位置已被使用过。那么其值为100,实际上就是上一个索引存放的Index偏移量,假设此时的indexCount为200,那么存储的新索引条目的最后NextIndex offset =100,随后将该位置的slot置为indexCount,即200。
可以发现,slot的值永远保存着具有该hash值的最新索引条目的偏移量信息,而索引条目的NextIndex offset则保存着上一个具有该hash值的索引条目的偏移量信息,这实际上就是一个逻辑上的HashMap,使用链表的方式解决哈希冲突,并且采用头插法插入数据,因为最新的消息通常是最关心的。
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值