当记录号不是用于数据存取的主键时,应该使用 Hash和Btree算法。
Btree支持对数据查询、插入、删除的常数级速度。关键字可以为任意的数据结构。 因此,当在主键有序时,Btree算法应该被使用。(如果主键是时间戳)
Hash 和 Btree 两种方式在小的数据集合上几乎没有性能的差别。不过,由于Hash使用的是扩展线性HASH算法(extended linear hashing),可以根据HASH表的增长进行适当的调整。所以当一个数据集合足够大且关键字为随机分布时,采用Hash算法比较好。
Choose Database Access Method
Access Method | Description | Choosing Occasion |
B+树 | 关键字有序存储,并且其结构能随数据的插入和删除进行动态调整。为了代码的简单,Berkeley DB没有实现对关键字的前缀码压缩。B+树支持对数据查询、插入、删除的常数级速度。关键字可以为任意的数据结构。 | 1、 当Key为复杂类型时。 2、 当Key有序时。 |
Hash | DB中实际使用的是扩展线性HASH算法(extended linear hashing),可以根据HASH表的增长进行适当的调整。关键字可以为任意的数据结构。 | 1、 当Key为复杂类型。 2、 当数据较大且key随机分布时。 |
Recno | 要求每一个记录都有一个逻辑纪录号,逻辑纪录号由算法本身生成。相当于关系数据库中的自动增长字段。Recho建立在B+树算法之上,提供了一个存储有序数据的接口。记录的长度可以为定长或不定长。 | 1、 当key为逻辑记录号时。 2、 当非高并发的情况下。 |
Queue | 和Recno方式接近, 只不过记录的长度为定长。数据以定长记录方式存储在队列中,插入操作把记录插入到队列的尾部,相比之下插入速度是最快的。 | 1、 1、当key为逻辑记录号时。 2、 定长记录。 3、 高并发的情况下。 |
转帖:http://hi.baidu.com/xinzsky/blog/item/0652048176a794ddbd3e1ec5.html