rabbitmq中消息的存储

最新推荐文章于 2024-07-16 00:02:56 发布

Summerxxxx

最新推荐文章于 2024-07-16 00:02:56 发布

阅读量416

点赞数

分类专栏：【架构】【电商】

【架构】同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

【电商】

6 篇文章 0 订阅

订阅专栏

1. 大概原理：

所有队列中的消息都以append的方式写到一个文件中，当这个文件的大小超过指定的限制大小后，关闭这个文件再创建一个新的文件供消息的写入。文件名（*.rdq）从0开始然后依次累加。当某个消息被删除时，并不立即从文件中删除相关信息，而是做一些记录，当垃圾数据达到一定比例时，启动垃圾回收处理，将逻辑相邻的文件中的数据合并到一个文件中。

2. 消息的读写及删除：

rabbitmq在启动时会创建msg_store_persistent,msg_store_transient两个进程，一个用于持久消息的存储，一个用于内存不够时，将存储在内存中的非持久化数据转存到磁盘中。所有队列的消息的写入和删除最终都由这两个进程负责处理，而消息的读取则可能是队列本身直接打开文件进行读取，也可能是发送请求由msg_store_persisteng/msg_store_transient进程进行处理。

在进行消息的存储时，rabbitmq会在ets表中记录消息在文件中的映射，以及文件的相关信息。消息读取时，根据消息ID找到该消息所存储的文件，在文件中的偏移量，然后打开文件进行读取。消息的删除只是从ets表删除指定消息的相关信息，同时更新消息对应存储的文件的相关信息（更新文件有效数据大小）。

-record(msg_location, { msg_id, %%消息ID
ref_count, %%引用计数
file, %%消息存储的文件名
offset, %%消息在文件中的偏移量
total_size %%消息的大小
}).
-record(file_summary, { file, %%文件名
valid_total_size, %%文件有效数据大小
left, %%位于该文件左边的文件
right, %%位于该文件右边的文件
file_size, %%文件总的大小
locked, %%上锁标记垃圾回收时防止对文件进行操作
readers %%当前读文件的队列数
})

3. 垃圾回收：

由于执行消息删除操作时，并不立即对在文件中对消息进行删除，也就是说消息依然在文件中，仅仅是垃圾数据而已。当垃圾数据超过一定比例后（默认比例为50%），并且至少有三个及以上的文件时，rabbitmq触发垃圾回收。垃圾回收会先找到符合要求的两个文件（根据#file_summary{}中left，right找逻辑上相邻的两个文件，并且两个文件的有效数据可在一个文件中存储），然后锁定这两个文件，并先对左边文件的有效数据进行整理，再将右边文件的有效数据写入到左边文件，同时更新消息的相关信息（存储的文件，文件中的偏移量），文件的相关信息（文件的有效数据，左边文件，右边文件），最后将右边的文件删除。

4. 性能考虑：

（1）操作引用计数（flying_ets）

队列在进行消息的写入和删除操作前，会在flying_ets表里通过+1，-1的方式进行计数，然后投递请求给msg_store_persistent/msg_store_transient进程进行处理，进程在真正写操作或者删除之前会再次判断flying_ets中对应消息的计数决定是否需要进行相应操作。这样，对于频繁写入和删除的操作，概率减少实际的写入和删除。