leveldb源码学习——Cache

最新推荐文章于 2023-03-22 21:00:56 发布

longzuo

最新推荐文章于 2023-03-22 21:00:56 发布

阅读量844

点赞数

分类专栏： leveldb

本文链接：https://blog.csdn.net/longzuo/article/details/78169667

版权

leveldb 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

Leveldb中会使用cache来提高读取性能，cache两种数据，1，file meta信息，2，data block信息。
leveldb开放了cache的接口，用户可以通过自定义cache类，完成对cache的定制化实现，另外leveldb定义了一个default cache，叫做LRU cache，在用户未实现自定义cache类时，将使用此类作为level的cache，本文脱离业务，单纯分析LRU cache的实现.

首先概括此cache的特点，cache是为了提高性能，用户在获取数据前（读磁盘或者rpc）前，可以先通过在cache中查询，用户在存储数据后，需要把最新数据写入cache，或者失效之前的数据。

内存容量有限，所以cache需要限定capacity。如果插入的数据导致cache内存占用超出了capacity，则需要选择需要覆盖的数据。这是内存cache设计最重要的方面之一。

LRUcache的特点是使用least recently used 策略来选择需要覆盖的数据，即，内存中优先保存最近使用过的数据，而覆盖那些最久没有使用过的数据

leveldb中的 LRUcache，关键点有

使用hashtable 来实现查找节点
使用两个双链表来区分数据新鲜度，in-use链表中保存新鲜数据，lru-list中保存已经很久没有被使用的数据。通过节点的ref值来代表其新鲜度。

下面介绍具体类

LRUHandler

handler是cache中用到的基本存储单元，有三个身份
- 保存了k-v数据
- 双链表的节点
- hashtable的节点

// An entry is a variable length heap-allocated structure.  Entries
// are kept in a circular doubly linked list ordered by access time.
struct LRUHandle {
  void* value; //要cache的用户数据
  void (*deleter)(const Slice&, void* value); //释放数据的方法
  LRUHandle* next_hash;//hash表的指针
  LRUHandle* next;//双链表的指针
  LRUHandle* prev;
  size_t charge;      // TODO(opt): Only allow uint32_t?
  size_t key_length;
  bool in_cache;      // Whether entry is in the cache.
  uint32_t refs;      // References, including cache reference, if present.
  uint32_t hash;      // Hash of key(); used for fast sharding and comparisons
  char key_data[1];   // Beginning of key

  Slice key() const {
    // For cheaper lookups, we allow a temporary Handle object
    // to store a pointer to a key in "value".
    if (next == this) {
      return *(reinterpret_cast<Slice*>(value));
    } else {
      return Slice(key_data, key_length);
    }                                                                                                                                                                              
  }
};