levelDB-源码解读日志二

上一篇我们队leveldb功能和静态结构有个基础的认识,那么现在我们主要对leveldb源码下各个文件的作用和结构做一个梳理。搞清楚各个类的功能和层级关系。

首先时include下的头文件:

include
└── leveldb
    ├── c.h              => c binding
    ├── cache.h          => cache接口
    ├── comparator.h     => 比较器接口
    ├── db.h             => DB接口
    ├── env.h            => 为跨平台准备的env接口
    ├── filter_policy.h  => fliter策略,用于缓存,请看到文档及相应实现
    ├── iterator.h       => 迭代器,用于遍历数据库中存储的数据
    ├── options.h        => 包含控制数据库的Options,控制读的WriteOptions,ReadOptions
    ├── slice.h          => Slice的接口
    ├── status.h         => leveldb中大多接口返回的Status接口
    ├── table.h           => immutable接口
    ├── table_builder.h  => 用于创建table的构建器接口
    └── write_batch.h    => 使多个写操作成为原子写的接口

c.h作用是为了leveldb的C绑定。可用作稳定的ABI,可由将leveldb保留在共享库中的程序使用,也可以用于JNI api。

(我们这里主要关注c++11版本的leveldb,所以做个了解就好,用c将大部分c++的接口进行了封装,让c语言也可以使用leveldb。)

cache.h

顾名思义就是缓存啦,这里采用的时LRU策略,同时对于不同条目会有动态的空间花费。观察相应成员,成员函数:插入,查找,释放,删除,注意到这里定义了一个空的结构体handler,handler的作用时在cache中实现kv之间的映射,至于为什么时空的,查阅博客知道所以Handle仅仅是一个虚的结构体.在具体实现时,可以参考leveldb.先自己定义一个结构体,在实现Cache相应的函数时,在返回或使用时调用reinterpret_cast<Cache::Handle*>。个人理解是先声明一个空的结构体占位一下,日后可以具体实现。私有成员以及函数没理解。在LRUCache中果然也没有对应实现。所以暂时不说。

slice.h

slice是google定义的一个简单的结构体,其中只有两个成员,一个指向外存的指针,一个是大小。

slice的使用必须保证对应的外存没有被释放,同时多线程可以调用一个slice的常量方法无需同步,非常量则需要同步。

slice其实是google对字符串操作的精简版,相较c++ 自带的string,slice更加精简,本身无法动态开辟空间,从拷贝函数可以看出,拷贝的仅仅是一个指针。因此,开销会小很多。同时,C++ string和以null结尾的C风格字符串可以很方便的转换成Slice

status.h

status.h中包含了Status的声明.Status是leveldb大多数函数调用的返回值.其作用类似于errno,只不过封装的更为完善,也更为c++.

Status的数据存储在state_中.state_是一个长度至少为6的字符串.前四位为message的length,第5位为status的状态,再之后的为message.

table.h

table是一个字符串排序后的表,它是不可改动的。成员函数包括了从文件中读取table等一些操作

table_builder.h

table_builder主要是提供构建table的相关接口函数。

option.h

option主要定义了数据库中各个部分的参数,数据压缩类型,比较函数,block的size,读的参数,写的参数,等。

writebatch.h

定义了插入,删除数据的一些原子操作,以及利用handler对数据的批量操作。这里提到了append要比用iterate然后每个都put要快,这里我还没看具体实现,还不知道为啥,先mark。

env.h

env.h 将系统调用,文件操作,文件锁,线程库等系统调用进行了封装,成为了Env.另外将文件抽象成了RandomAccessFile,SequentialFile,WritableFile.这么抽象的好处显而易见: 跨平台更为简单.客户端调用接口抽象出来的一致方法.使得不同平台下的代码更为一致.而实现跨平台也很简单.无论是windows,还是*nix,甚至是android及ios,各个平台只需要实现相应的方法就能完成port的工作.这种方式在开发跨平台代码时很值得借鉴.

filter_policy.h

filter_policy.h 作用是利用过滤器来查找key值的有无,https://www.jianshu.com/p/2104d11ee0a2这篇文章讲的很好。关于布隆过滤器的。

db.h

db.h是使用leveldb时最经常include的头文件.在这个头文件中提供了DB的接口的定义,也是我们需要的部分.在db.h中,定义了Snapshot,Range,DB三个接口.Range为一个Slice对,定义了[start,end).符合C++的习惯.Snapshot为DB的某个特定状态.由于其只读,因此多线程访问并不需要锁.还有一些相应的函数,文档写的很清楚。就不过多赘述了。

 

这次主要解读了include文件夹下头文件的意义。下一章我们将从静态结构入手,逐步仔细分析各组件的具体实现。

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要阅读Leveldb源码,你可以按照以下步骤进行: 1. 确保你对C++语言有基本的了解。Leveldb是用C++编写的,因此你需要熟悉C++的语法和面向对象编程的概念。 2. 阅读Leveldb的README文件。这个文件提供了关于Leveldb的基本信息,如其用途、功能和性能特征。同时,它还列出了Leveldb的依赖关系,这对于理解源码以及构建和运行Leveldb非常重要。 3. 了解Leveldb的核心概念和数据结构。Leveldb是一个高效的键值存储库,它使用了一些关键的数据结构,如有序字符串表(Skip List)和持久化存储。 4. 查看Leveldb的目录结构。Leveldb源码包含了一些核心文件和目录,如“db”目录下的文件是Leveldb的核心实现。理解源码的组织结构可以帮助你快速找到感兴趣的部分。 5. 阅读核心文件的源码。从“db/db_impl.cc”文件开始,这个文件是Leveldb的主要实现。阅读这个文件可以帮助你了解Leveldb如何管理内存、实施并发控制和实现持久化存储。 6. 跟踪函数调用和数据流。了解Leveldb的主要功能是如何通过函数调用进行实现的很重要。你可以使用调试器或添加日志输出来跟踪函数调用和数据流,这有助于你了解代码的执行流程和逻辑。 7. 阅读Leveldb的测试用例。Leveldb源码中包含了大量的测试用例,这些用例对于理解Leveldb的不同功能和特性非常有帮助。通过阅读和运行这些测试用例,你可以对Leveldb的行为有更深入的了解。 8. 参考文档和论文。如果你想更深入地了解Leveldb的实现原理和技术细节,可以查阅Leveldb的官方文档或相关的论文。这些文档可以为你提供更详细的信息和背景知识。 最后,要理解Leveldb源码并不是一件简单的任务,需要投入大量的时间和精力。所以,建议你在阅读源码之前,对C++和数据库原理有一定的了解和经验,同时也要具备耐心和持续学习的精神。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值