RocketMQ学习笔记:消息存储模型,持久化文件,过期文件删除

这是本人学习的总结,主要学习资料如下


1、消息存储结构

消息在消息队列中的存储结构如下所示。这三个模块都是文件。默认放在${user.home}/store之下。

  • 首先是左边的CommitLog,不管是什么topic,所有的消息都是放到这个集合之中。存储着消息的topicmessage等消息的元数据。
  • 右上角的是Comsummequeue,是逻辑消息队列,代表着一个topic底下的一个queue。里面顺序存放着属于这个queue的所有消息。不过这是存放消息的地址和偏移量,消息的其他信息还需要到CommitLog中读取。
  • Index则是记录着所有消息的索引。RocketMQ提供通过idKey来快速查询到一个msg。因为id是由brokerId+offset构成的,所以自然能从commitLog中读取消息。Index中则记录keyoffset的映射,所以可以通过key快速找到一个msg

1.1、CommitLog详解

CommitLog采访者消息的所有元信息。每个CommitLog都被本机上的所有queue共享,与消息的topic等无关。

消息的存储结构和Redis的压缩列表类似。每个消息的前面存放一些元数据,后面放消息的具体内容。这样每个消息的长度是不固定的。
请添加图片描述

每个CommitLog文件默认是1G。如果消息塞满了一个文件则会生成一个新的,并且令其初始偏移量在上一个文件的基础上加1073741824(1G = 1073741824byte)。

在写消息时,尽管有多个生产者会同时发送消息,但永远是一个一个地往CommitLog中写消息。

1.1.1、CommitLog存储的优点

  1. CommitLog 顺序写 ,可以大大提高写入效率。
    实际上,磁盘有时候会比你想象的快很多,有时候也比你想象的慢很多,关键在如何使用,使用得当,磁盘的速度完全可以匹配上网络的数据传输速度。目前的高性能磁盘,顺序写速度可以达到600MB/s ,超过了一般网卡的传输速度,这是磁盘比想象的快的地方 但是磁盘随机写的速度只有大概lOOKB/s,和顺序写的性能相差 6000 倍。
  2. 虽然是随机读,但是利用操作系统的 pagecache 机制,可以批量地从磁盘读取,作为 cache 存到内存中,加速后续的读取速度。
  3. 为了保证完全的顺序写,需要ConsumeQueue这个中间结构 ,因为ConsumeQueue 里只存偏移量信息,所以尺寸是有限的,在实际情况中,大部分的 ConsumeQueue能够被全部读入内存,所以这个中间结构的操作速度很快,可以认为是内存读取的速度。此外为了保证 CommitLogConsumeQueue的一致性, CommitLog 里存储了 Consume QueuesMessage KeyTag 等所有信息,即使 ConsumeQueue 丢失,也可以通过CommitLog 完全恢复出来。



1.2、ConsumeQueue详解

ComsumeQueue是一个逻辑队列,代表了一个topic下的一个queue。它里面只存储消息的索引,不存具体的信息,具体的消息信息要到CommitLog中寻找。

下面是具体存储结构。
在这里插入图片描述

1.3、Index详解

RocketMQ提供通过idKey来快速查询到一个msg。因为id是由brokerId+offset构成的,所以自然能从commitLog中读取消息。Index中则记录keyoffset的映射,所以可以通过key快速找到一个msg

2、持久化文件

RocketMQ的持久化文件默认会放到${user.home}/store目录下,也可以在broker.conf中配置storePathRootDir修改路径。

一般有下面这几个文件。
请添加图片描述

  • commitlog: 消息存储的元数据
  • config:运行期间的一些配置信息。
  • consumerqueue:消息消费对了存储目录。
  • index:消息索引文件存储目录。
  • abort:如果存在该文件则表示MQ是非正常关闭的。
  • checkPoint:文件检查点,存储着commitlogconsumerqueueindex文件最后一次刷盘时间戳。

3、过期文件删除机制

3.1、判断过期文件

RocketMQ的持久化文件不会永远存在,每隔一段时间就会清理掉一部分。主要是删除CommitLogConsumeQueue这两个文件。

RocketMQ中,一段时间内没更新的文件就被视为过期文件,不管里面的消息是不是全都被消费了。

默认是42小时没有更新就删除,默认时间根据版本的不同而不同,这个也是可以在broker.config中配置的,fileReserveTime

删除文件是由定时任务做的,默认10s扫描一次。

判断是否要删除过期文件的机制总共和下面这几个个参数有关

  • fileReserveTime:单位小时,超过这个时间没更新的文件就是过期文件。
  • destroyMapedFileIntervalForcibly:当清理线程准备删除一个文件时,如果这个文件还被其他线程引用,取消这次删除操作并记录当前时间。destroyMapedFileIntervalForcibly表示在一段时间内(单位是ms),会一直保留这个文件。超过这个时间以后,每次清理线程发现这个文件就会减少1000个对该文件的引用,直到引用数变成0,删除该文件。

3.2、删除的时机

默认是10秒一次扫描,但是有下面的特殊情况也会触发扫描。

  • deleteWhen:将扫描时间固定成一天当中的某个时刻执行一次,比如凌晨4点。
  • DiskSpaceCleanForciblyRatio:默认值85。表示磁盘空间使用率达到85%以后,就会立刻启动过期文件删除机制。
  • 30
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
持久化splay是一种数据结构,它是对splay树进行修改和查询的一种扩展。在传统的splay树中,对树的修改操作会破坏原有的树结构,而可持久化splay树则允许我们对树进行修改、查询,并且可以保存修改后的每个版本的树结构。 在可持久化splay树中,我们不会直接对原树进行修改,而是通过复制每个节点来创建新的版本。这样,每个版本都可以独立地修改和查询,保留了原有版本的结构和状态。每个节点保存了其左子树和右子树的引用,使得可以在不破坏原有版本的情况下进行修改和查询。 为了实现可持久化splay树,我们可以使用一些技巧,比如引用中提到的哨兵节点和假的父节点和孩子节点。这些技巧可以帮助我们处理根节点的旋转和其他操作。 此外,可持久化splay树还可以与其他数据结构相结合,比如引用中提到的可持久化线段树。这种结合可以帮助我们解决更复杂的问题,比如区间修改和区间查询等。 对于可持久化splay树的学习过程,可以按照以下步骤进行: 1. 理解splay树的基本原理和操作,包括旋转、插入、删除和查找等。 2. 学习如何构建可持久化splay树,包括复制节点、更新版本和保存历史版本等。 3. 掌握可持久化splay树的常见应用场景,比如区间修改和区间查询等。 4. 深入了解与可持久化splay树相关的其他数据结构和算法,比如可持久化线段树等。 在解决问题时,可以使用二分法来确定答案,一般称为二分答案。通过对答案进行二分,然后对每个答案进行检查,以确定最终的结果。这种方法可以应用于很多问题,比如引用中提到的在线询问问题。 综上所述,可持久化splay是一种对splay树进行修改和查询的扩展,可以通过复制节点来创建新的版本,并且可以与其他数据结构相结合解决更复杂的问题。学习过程中可以按照一定的步骤进行,并且可以使用二分法来解决一些特定的问题。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [[学习笔记]FHQ-Treap及其可持久化](https://blog.csdn.net/weixin_34283445/article/details/93207491)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [可持久化数据结构学习笔记](https://blog.csdn.net/weixin_30376083/article/details/99902410)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值