跳表的原理就不写了,主要记录下实现中遇到的问题。
1.插入的新节点时分配高度:原本以为高度是随机的且越随机越好,于是简单的写下height = rand() % maxheight + 1,当然也不会报错什么的。但写完后和map一对比,数据规模2W时已经要比map要慢个10倍左右,而且随着数据增大,时间也不是对数级增长(花费更多时间),这和理论结果不符。想了想为什么跳表平均情况下能和rbtree差不多呢?最好的结果是每一层跳过的数量都是上一层*2,且分布均匀,这样理想状态就类似于avltree了。简单打印+调试了下查找过程,问题就出在每层的节点数量上了:
a)按照上面计算方式,假设有L层,N个数据。每一层的数量会为N/L, 2*N/L, 3*N/L,..,N。这样即使分布均匀,那每一层能跳的最多节点也就是N/L(理想状态第一层可以跳N,第二层能跳N/2,...1)。这无疑会导致查询效率较低。
b)改成:每次有1/2的概率层数+1,否则停止。这样每一层数量会为 N / 2^(L-1), N / 2^(L-2),...,N。比较符合理想状态,改完后效率立刻上来了。操作耗时大概是map的2倍。
2.写这个东西主要是工作中用到ssdb,而存储层的leveldb在内存数据结构上是跳表。突然想到这玩意好像还没实现过,于是写了下。自然的,也要写hrscan这样具备反向查找的功能。写完后觉得,反向查找其实也可以用正向实现,找到节点后直接在最底层反向遍历即可。不过既然是反向,那比较多的应用场景应该是从尾部开始,取多少个。于是感觉还是手动写个从尾部遍历的也许会更符合应用场景吧。
附实现代码和测试结果:
.h
#pragma once
#include <string.h>
#include <stdlib.h>
namespace
{
struct LKNode
{
LKNode* next;
LKNode* prev;
void* header;
LKNode() { memset(this, 0, sizeof(this)); }
};
template<typename key_t, typename val_t>
struct SLNode
{
key_t key;
val_t val;
int height;
LKNode node[1];
SLNode(int h, const key_t& k, const val_t& v)
: height(h)
, key(k)
, val(v)
{
for (int i = 0; i < height; ++i)
{
node[i].next = node[i].prev = NULL;
node[i].header = this;
}
}
};
struct DefaultRand
{
int operator()(int nMaxHeight)
{
int l = 1;
while ((rand() & 1) && l < nMaxHeight) ++l;
return l;
}
};
}
template<typename key_t, typename val_t, typename randfun = DefaultRand, typename keycomp_t = less<key_t> >
class SkipList
{
public:
typedef SLNode<key_t, val_t> node_t;
typedef keycomp_t cmp_t;
typedef SkipList<key_t, val_t, randfun, keycomp_t> this_t;
SkipList(int nMaxHeight);
~SkipList();
bool Set(const key_t& key, const val_t& val);
bool Get(const key_t& key, val_t& val);
bool Erase(const key_t& key);
void Clear();
bool Empty() const { return m_nCount == 0; }
int Size() const { return m_nCount; }
// (last, first] in reverse order
template<typename Container>
void RScan(const key_t& keyfirst, const key_t& keylast, Container& vals, unsigned int limit = -1);
// [first, last)
template<typename Container>
void Scan(const key_t& keyfirst, const key_t& keylast, Container& vals, unsigned int limit = -