分布式缓存学习笔记（五）—— 批量写入

最新推荐文章于 2024-05-30 19:23:49 发布

DoinNN

最新推荐文章于 2024-05-30 19:23:49 发布

阅读量586

点赞数

分类专栏：分布式缓存系统文章标签：缓存分布式 golang 系统架构

本文链接：https://blog.csdn.net/weixin_42149424/article/details/130787474

版权

分布式缓存系统专栏收录该内容

9 篇文章

订阅专栏

文章探讨了如何通过RocksDB的批量写入功能优化缓存服务的Set操作，减少磁盘寻道时间和旋转延迟，提高磁盘IO效率。虽然这可能导致写入结果的不确定性及数据一致性问题，但由于是缓存服务，这些缺陷在可接受范围内。测试显示，批量写入能显著提升写入性能，尤其是在结合pipelining或多客户端并发时效果更佳。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

上一章介绍了利用pipelining技术在不改变任何服务端实现的情况下提升性能，这样的提升非常有限。本章将要做的是深入 RocksDB 内部，借助它的批量写入功能来给我们的缓存服务 Set 操作提速。

批量写入能够提升写入性能的原理

批量写入的原理和pipelining 的原理很接近，它是在服务端将收到的 Set 操作请求积攒起来，然后一次性写入磁盘。这样做的好处有 3 点

通过把多次小的写操作合并成一个大的写操作，减少了磁盘的寻道时间和旋转延时，提升了磁盘IO的效率
写入的内容会被集中放在连续的内存里，减少了 CPU 载入内存的次数和 cache miss 的概率(这里的 cache 指的是 CPU和内存之间的缓存)
缓存的Set 操作现在可以尽快返回而不需要等待磁盘操作的结果，这意味着我们的缓存服务可以在相同的时间里处理更多的请求。

批量写入也有两个缺陷

我们不再可以知晓每一次缓存 Set操作的真实结果，缓存服务总是把成功的响应返回给客户端，但是等到真正进行批量写入的时候却有可能失败，那时我们已经没有办法把这个错误通知到客户端了。
我们不再能够保证 Set 操作的实时一致性了，当客户端 Set 操作返回后，客户端会认为键值对已经进入了缓存，但是当它下次打算来获取这个键值对时，它可能还在批量写入的队列里没有被真正写入磁盘。

这两个缺陷成因不同，但结果都是写入的键值对暂时或永久丢失。

好在本书实现的是缓存服务，不是存储服务。缓存的设计从一开始就明白数据是可以丢失的，所以客户端不会对获取不到成功 Set 的键值对感到惊讶。也就是说，这两个缺陷都是客户端可以容忍的。

RocksDB 批量写入性能测试

本书源码的rocksdb_performance/子目录中还有一个test batch write测试程序之前没有提到过。这个程序是专门用来测试 RocksDB 批量写入性能的，用法如下:

$ ./test batch write --help
Allowed options:
	-h [ --help]                  produce help message
	-t[--total]arg (=10000)       total record number
	-s[--size ]arg (=1000)        value size

batch write option:
-b [ --batch size ] arg (=l) batch size