【leveldb】Memtable-实现(十)

通过对Memtable所使用到的Key的详细介绍Key介绍,接下来对Memtable的实现讲解则轻松的多。

一、结构

Memtable以一个个Entry为单元进行存储,Entry结构图如下:
在这里插入图片描述

图1
  • Klength = UserKey.length + 8 (sequenceNumber + ValueType);
  • Vlength = Value.length。
二、关联类
  • InternalKeyComparator:实现key(InternalKey)的比较;
  • Arena:内存管理;
  • SkipList<const char*, KeyComparator>:利用SkipList来存储管理Entry。
三、源码解读
memtable.h
namespace leveldb {

<!InternalKey的比较类>
class InternalKeyComparator;

<!Memtable迭代器实现>
class MemTableIterator;

class MemTable {
 public:

  <!显示声明,要传入比较类>
  // MemTables are reference counted.  The initial reference count
  // is zero and the caller must call Ref() at least once.
  explicit MemTable(const InternalKeyComparator& comparator);

  MemTable(const MemTable&) = delete;
  MemTable& operator=(const MemTable&) = delete;
  
  <!通过引用计数的方式来使用MemTable>
  // Increase reference count.
  void Ref() { ++refs_; }

  // Drop reference count.  Delete if no more references exist.
  void Unref() {
    --refs_;
    assert(refs_ >= 0);
    if (refs_ <= 0) {
      delete this;
    }
  }

  <!获取大概的内存使用大小>
  // Returns an estimate of the number of bytes of data in use by this
  // data structure. It is safe to call when MemTable is being modified.
  size_t ApproximateMemoryUsage();
   
   <!新建一个迭代器,在迭代器使用期间,MemTable要确保是有效的。> 
  // Return an iterator that yields the contents of the memtable.
  //
  // The caller must ensure that the underlying MemTable remains live
  // while the returned iterator is live.  The keys returned by this
  // iterator are internal keys encoded by AppendInternalKey in the
  // db/format.{h,cc} module.
  Iterator* NewIterator();

  <!添加一个Value>
  // Add an entry into memtable that maps key to value at the
  // specified sequence number and with the specified type.
  // Typically value will be empty if type==kTypeDeletion.
  void Add(SequenceNumber seq, ValueType type, const Slice& key,
           const Slice& value);

  <!通过LookupKey,获取对应的Value值:
    1.Key值存在,则返回true,值存在*value中;
    2.Key值如果是被删除状态,则返回true,状态存放在*s中;
    3.如果为找到Key值,则返回false>
  // If memtable contains a value for key, store it in *value and return true.
  // If memtable contains a deletion for key, store a NotFound() error
  // in *status and return true.
  // Else, return false.
  bool Get(const LookupKey& key, std::string* value, Status* s);

 private:
  friend class MemTableIterator;
  friend class MemTableBackwardIterator;

  <!内部重新封装下Key Comparator,重载了operator()>
  struct KeyComparator {
    const InternalKeyComparator comparator;
    explicit KeyComparator(const InternalKeyComparator& c) : comparator(c) {}
    int operator()(const char* a, const char* b) const;
  };
  
  <!跳表声明,Key值是const char*>
  typedef SkipList<const char*, KeyComparator> Table;

  <!私有,只会在Unref中被调用到>
  ~MemTable();  // Private since only Unref() should be used to delete it
  
  <Key比较器>
  KeyComparator comparator_;
  
  <!MemTable被引用的次数>
  int refs_;
  
  <!Memtable Entry的内存管理>
  Arena arena_;
  
  <!用于存储管理Entry的跳表结构>
  Table table_;
};

}  // namespace leveldb

memtable.cc
namespace leveldb {

<!获取InternalKey>
static Slice GetLengthPrefixedSlice(const char* data) {
  uint32_t len;
  const char* p = data;
  <!因为Varint32最多占用5Byte,这里默认+5,
   保证内部地址判断合法,取到正确的长度。
  >
  p = GetVarint32Ptr(p, p + 5, &len);  // +5: we assume "p" is not corrupted
  return Slice(p, len);
}

MemTable::MemTable(const InternalKeyComparator& comparator)
    : comparator_(comparator), refs_(0), table_(comparator_, &arena_) {}

<!析构是由Unref()调用,此时refs_ == 0>
MemTable::~MemTable() { assert(refs_ == 0); }

<!获取此时MemTable消耗的内存大小>
size_t MemTable::ApproximateMemoryUsage() { return arena_.MemoryUsage(); }

<!Key比较的二次封装,取出aptr和bptr对应的
 InternalKey,然后进行比较。此处使用的SkipList
 内部都是比较InternalKey来排序的。
>
int MemTable::KeyComparator::operator()(const char* aptr,
                                        const char* bptr) const {
  // Internal keys are encoded as length-prefixed strings.
  Slice a = GetLengthPrefixedSlice(aptr);
  Slice b = GetLengthPrefixedSlice(bptr);
  return comparator.Compare(a, b);
}

<!此处就是编码一个LookUPKey格式的数据,存于临时内存*scratch中>
// Encode a suitable internal key target for "target" and return it.
// Uses *scratch as scratch space, and the returned pointer will point
// into this scratch space.
static const char* EncodeKey(std::string* scratch, const Slice& target) {
  scratch->clear();
  PutVarint32(scratch, target.size());
  scratch->append(target.data(), target.size());
  return scratch->data();
}

<!MemTable的迭代器,基本上使用的是SkipList中iterator>
class MemTableIterator : public Iterator {
 public:
  explicit MemTableIterator(MemTable::Table* table) : iter_(table) {}

  MemTableIterator(const MemTableIterator&) = delete;
  MemTableIterator& operator=(const MemTableIterator&) = delete;

  <!default,指定编译器合成一个析构函数。使用default作用:
   1. 可不用程序员自己再去实现方法。
   2. 编译器实现的效率会高些。
  >
  ~MemTableIterator() override = default;

  bool Valid() const override { return iter_.Valid(); }
  <!此处通过EncodeKey,编码一个LookUPKey用于定位>
  void Seek(const Slice& k) override { iter_.Seek(EncodeKey(&tmp_, k)); }
  void SeekToFirst() override { iter_.SeekToFirst(); }
  void SeekToLast() override { iter_.SeekToLast(); }
  void Next() override { iter_.Next(); }
  void Prev() override { iter_.Prev(); }
  
  <!此处返回一个InternalKey>
  Slice key() const override { return GetLengthPrefixedSlice(iter_.key()); }

  <!返回InternalKey对应的Value>
  Slice value() const override {
    Slice key_slice = GetLengthPrefixedSlice(iter_.key());
    return GetLengthPrefixedSlice(key_slice.data() + key_slice.size());
  }

  Status status() const override { return Status::OK(); }

 private:
  MemTable::Table::Iterator iter_;
  std::string tmp_;  // For passing to EncodeKey
};

Iterator* MemTable::NewIterator() { return new MemTableIterator(&table_); }

<!编码一个Memtable entry存入SkipList数据结构中。
 看懂了Memtable entry结构就很好理解下面的过程了。
 最后的buf中存的就是一个Memtable entry。
>
void MemTable::Add(SequenceNumber s, ValueType type, const Slice& key,
                   const Slice& value) {
  // Format of an entry is concatenation of:
  //  key_size     : varint32 of internal_key.size()
  //  key bytes    : char[internal_key.size()]
  //  value_size   : varint32 of value.size()
  //  value bytes  : char[value.size()]
  size_t key_size = key.size();
  size_t val_size = value.size();
  size_t internal_key_size = key_size + 8;
  const size_t encoded_len = VarintLength(internal_key_size) +
                             internal_key_size + VarintLength(val_size) +
                             val_size;
  char* buf = arena_.Allocate(encoded_len);
  char* p = EncodeVarint32(buf, internal_key_size);
  memcpy(p, key.data(), key_size);
  p += key_size;
  EncodeFixed64(p, (s << 8) | type);
  p += 8;
  p = EncodeVarint32(p, val_size);
  memcpy(p, value.data(), val_size);
  assert(p + val_size == buf + encoded_len);
  table_.Insert(buf);
}

<!根据LookupKey查询出对应的Value>
bool MemTable::Get(const LookupKey& key, std::string* value, Status* s) {
  <!就是LookupKey>
  Slice memkey = key.memtable_key();
  Table::Iterator iter(&table_);
  
  <!根据LookupKey进行查找,找到了则
   iter.Valid()true,否则false>
  iter.Seek(memkey.data());
  if (iter.Valid()) {
    // entry format is:
    //    klength  varint32
    //    userkey  char[klength]
    //    tag      uint64
    //    vlength  varint32
    //    value    char[vlength]
    // Check that it belongs to same user key.  We do not check the
    // sequence number since the Seek() call above should have skipped
    // all entries with overly large sequence numbers.
    const char* entry = iter.key();
    uint32_t key_length;
    const char* key_ptr = GetVarint32Ptr(entry, entry + 5, &key_length);

    <!因为上述Seek是找的大于等于key的值,所以此处还需要直接和UserKey比较下。
      这里的Compare内部仅仅是比较UserKey,不是涉及到其他的。
    >
    if (comparator_.comparator.user_comparator()->Compare(
            Slice(key_ptr, key_length - 8), key.user_key()) == 0) {

      <!如果确实找到了UserKey,则通过TypeValue来判断下是否是被删除的。
       删除的话就在*s中返回NotFound状态。
      >
      // Correct user key
      const uint64_t tag = DecodeFixed64(key_ptr + key_length - 8);
      switch (static_cast<ValueType>(tag & 0xff)) {
        case kTypeValue: {
          Slice v = GetLengthPrefixedSlice(key_ptr + key_length);
          value->assign(v.data(), v.size());
          return true;
        }
        case kTypeDeletion:
          *s = Status::NotFound(Slice());
          return true;
      }
    }
  }
  return false;
}

}  // namespace leveldb

四、总结
  1. Memtable的Get中对取得的Value值都是直接拷贝的,如果Value越大,消耗则越大。
  2. Memtable是利用Lookupkey来作为key使用。
  3. SkipList第0层是从小到大排序的。
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值