levelDB中Slice非常简单的数据结构,它包括length和一个指向外部字节数组的指针。为什么使用Slice,而不直接使用std::string呢?
1、相比返回string,返回Slice的开销会小的多(没有拷贝(数据),Slice中没有实际数据,只有指向数据的指针,开销低,因为拷贝也只是拷贝了指针而已)。
2、leveldb允许key和value包含’\0’,不能返回以null结尾的c风格字符串。
string和以null结尾的C风格字符串可以很方便的转换成Slice:
leveldb::Slice s1 = "hello";
对应构造函数为
Slice(const char* s) : data_(s), size_(strlen(s)) { }
不同编译器对s1的构造方法不同,在vs中,直接调用上述构造函数,但在g++中,先用上述构
造函数创建一个临时对象,然后在调用s1的拷贝构造函数。
std::string str("world");
对应构造函数为
Slice(const std::string& s) : data_(s.data()),size_(s.size()){ }
这个需要注意的是,如果str析构了,在使用用str构建的slice就会有问题
Slice也很容易转换成C++风格string:
std::string str = s1.ToString();
对应slice函数为
std::string ToString() const { return std::string(data_, size_); }
//会不会调用string的拷贝构造函数?深拷贝还是浅拷贝?我在vs下做的实验是深拷贝
//也就是说,我们对str的改变不会影响到s1。
使用Slice时需要格外小心,因为Slice引用的外部数组是由Slice的使用者保证在Slice的生命周期内外部数组是有效的。比如下面的代码中存在bug:
leveldb::Slice slice;
if (...) {
std::string str = ...;
slice = str;
}
Use(slice);
当if语句的作用域结束时,str会被析构,slice指向的外部空间就不存在了。
我们要始终注意slice中data_地址的有效性,而且在我们的slice里没有定义自己的析构函数,也就是说slice不会对data_所指的地址做任何操作。
代码很简单,我就不分析了,就写一点比较容易出错的地方
// Create an empty slice.
Slice() : data_(""), size_(0) { }//为啥不直接设为NULL呢?
bool Slice::starts_with(const Slice& x) const {
return ((size_ >= x.size_) &&
(memcmp(data_, x.data_, x.size_) == 0));
//slice内部的函数当然可以直接访问Slice x的私有变量
}
inline bool operator==(const Slice& x, const Slice& y) {
return ((x.size() == y.size()) &&
(memcmp(x.data(), y.data(), x.size()) == 0));
//不是slice内部函数,不能直接访问x和y的私有变量。
}