摘要
针对leveldb,rocksdb,hbase,COLA,SAMT等MSLS设计,本文提出一种评价方法,可以更准确的判断insert的开销,以及最优的参数配置。
detail
目标是针对不同MSLS设计,准确的评估模型写放大的效应。而写放大与几个因素有关,重复key会导致总体上写到磁盘上的数据变少;用unique(映射一系列请求与对应的请求中uniquekey的数量)和unique的逆函数定义了merge过程的开销?
对leveldb进行分析建模,WAL日志贡献了一倍的写放大,level0会对WAL中的数据量做一次uniquekey的映射倍的写放大。
nonuniformity,最近compact生成的文件倾向于有更小的keyrange。keyrange越窄的tablefile,交叠的下层tablefile也越少。nonuniformity这个概念没太理解。