leveldb 是一个允许修改的数据库,因此其对于 LSM 的使用和 clickhouse 类似,主要的不同在于写入日志后的操作不同。
clickhouse 在记录日志后,会直接在内存中进行排序,从而写入磁盘。此时如果 clickhouse 又接到一条写入情况,会重新开启一个新的进程。
而 leveldb 在记录日志后,会将数据首先缓存在内存中,等待后续操作继续操作这块内存,直到这块内存被填满,才会一次性将数据写入磁盘。优品拍拍
这个差异主要时两个数据库面向的场景不同,clickhouse 主要面向读多写少的分析场景,强调大批量一次性写入增加吞吐量。而 leveldb 主要面向写多读少的业务场景,强调低延时。
吞吐量和延时一向是互相对立的两个指标,不同系统都在这两个指标之间存在取舍。后续有机会我也会写一篇关于这两个指标之间的相爱相杀,以及知名开源软件在这两个指标之间的思考。