在前文的leveldb文件层次结构中,内存中只显示了memtable,然而内存中不只有memtable,实际上leveldb在内存中维持了sst文件内容的缓存。这里介绍leveldb的cache实现和两个使用场景。
LRU实现
leveldb提供了一个Least recently used的缓存实现,源码位置:include/leveldb/cache.h util/cache.cc
如图,leveldb的LRU实现包含一个hash表和两个双链表,查找数据在hash表中进行,hash使用拉链法,next_hash指向同一个桶中的下一个节点。in_use和lru两个双链表用于实现LRU逻辑。每个entry维持一个ref计数,初始为1,初始时所有entry都在lru链表中。每次外部查找引用一个entry时ref+1,使用完成后释放引用ref-1。当一个entry第一次获得外部引用时,ref从1变成2,entry从lru中移动到in_use。每次一个entry的ref从2变成1,说明失去了所有外部引用,此时从in_use中移动到lru中。插入lru永远在prev,从而实现lru中的entry按照最后一次使用时间排序。当内存超限,在lru中按序从next方向清理节点。
分片机制
LRU cache内部通过mutex同步,会发生冲突,leveldb通过分片缓解此问题,当前leveldb分16个shard,根据key的hash值分到不同shard
使用场景
leveldb在两个地方使用cache,一个是table的cache,一个是block的cache。table cache的key为sst文件名,value为一个table对象,table对象在内存中维护该table文件的data index block的内容和filter block的内容;block cache的key为cache_id + offset,cache_id由cache实现分配,全局唯一,这样组成的key可以唯一定位一个block,value为该block内容。table cache的容量限制为个数,目前leveldb支持约1000个table的缓存;block缓存的限制为大小,目前默认使用一个8MB的cache