哈希树的理论基础
【
质数分辨定理
】
简单地说就是:
n个不同的质数可以“分辨”的连续整数的个数和他们的乘积相等
。“分辨”就是指这些连续的整数不可能有完全相同的余数序列。
(这个定理的证明详见:
http://wenku.baidu.com/view/16b2c7abd1f34693daef3e58.html
)
例如:
从2起的连续质数,连续10个质数就可以分辨大约M(10) =2*3*5*7*11*13*17*19*23*29= 6464693230 个数,已经超过计算机中常用整数(32bit)的表达范围。连续100个质数就可以分辨大约M(100) = 4.711930 乘以10的219次方。
而按照目前的CPU水平,100次取余的整数除法操作几乎不算什么难事。在实际应用中,整体的操作速度往往取决于节点将关键字装载内存的次数和时间。一般来说,装载的时间是由关键字的大小和硬件来决定的;在相同类型关键字和相同硬件条件下,实际的整体操作时间就主要取决于装载的次数。他们之间是一个成正比的关系。
我们选择质数分辨算法来建立一棵哈希树。
选择从2开始的连续质数来建立一个十层的哈希树。第一层结点为根结点,根结点下有2个结点;第二层的每个结点下有3个结点;依此类推,即每层结点的子节点数目为连续的质数。到第十层,每个结点下有29个结点。如下图所示:
同一结点中的子结点,从左到右代表不同的余数结果。
例如:第二层结点下有三个子节点。那么从左到右分别代表:除3余0,除3余1,除3余2.
对质数进行取余操作得到的余数决定了处理的路径。
结点:结点的关键字(在整个树中是唯一的),结点的数据对象,结点是否被占据的标志位(标志位为真时,关键字才被认为是有效的),和结点的子结点数组。
特点:
1.哈希树的结构是动态的,也不像某些哈希算法那样需要长时间的初始化过程,只需要初始化根结点就可以开始工作。哈希树也没 有必要为不存在的关键字提前分配空间。
2.查找迅速,最多只需要10次取余和比较操作,就可知道这个对象是否存在。哈希树的查找次数和元素个数没有关系。
3.结构不变,哈希树在删除的时候并不做任何结构调整。这也是它的一个非常好的优点。常规树结构在增加元素和删除元素的时候都要做一定的结构调整。
4.非排序性,哈希树不支持排序,没有顺序特性。
需要注意的是:哈希树是一个单向增加的结构,即随着所需要存储的数据量增加而增大。即使数据量减少到原来的数量,但是哈希树的总结点树不会减少。这样做的目的是为了避免结构的调整带来的额外消耗。
代码:
-
-
- #include "stdafx.h"
- #include <iostream>
- using namespace std;
-
- const int SIZE = 32;
- const int Prime[10] = {2,3,5,7,11,13,17,19,23,29};
-
- template<class T1, class T2>
- class HashNode
- {
- public:
- HashNode();
- HashNode(T1 key, T2 value);
- ~HashNode();
-
- public:
- T1 m_key;
- T2 m_value;
- bool occupied;
- HashNode *child[SIZE];
- };
-
- template<class T1, class T2>
- HashNode<T1,T2>::HashNode()
- {
- occupied=false;
- memset(child, NULL, SIZE*sizeof(HashNode<T1,T2>*));
- }
-
- template<class T1, class T2>
- HashNode<T1,T2>::HashNode(T1 key, T2 value)
- {
- this->m_key = key;
- this->m_value = value;
- occupied=false;
- memset(child, NULL, SIZE*sizeof(HashNode<T1,T2>*));
- }
-
- template<class T1, class T2>
- HashNode<T1,T2>::~HashNode()
- {
-
- }
-
-
- template<class T1, class T2>
- class HashTree
- {
- public:
- HashTree();
- ~HashTree();
- void InsertNode(T1 key, T2 value);
- bool FindNode(T1 key, T2 &value);
- void DeleteNode(T1 key);
-
-
- private:
- HashNode<T1,T2> *root;
- void Insert(HashNode<T1,T2> *hashNode, int level, T1 key, T2 value);
- bool Find(HashNode<T1,T2> *hashNode, int level, T1 key, T2 value);
- void Delete(HashNode<T1,T2> *hashNode, int level,T1 key);
- };
-
- template<class T1, class T2>
- HashTree<T1,T2>::HashTree()
- {
- root = new HashNode<T1,T2>;
- }
-
- template<class T1, class T2>
- HashTree<T1,T2>::~HashTree()
- {
-
- }
-
- template<class T1, class T2>
- void HashTree<T1,T2>::InsertNode(T1 key, T2 value)
- {
- Insert(root,0,key,value);
- }
-
- template<class T1, class T2>
- void HashTree<T1,T2>::Insert(HashNode<T1, T2> *hashNode, int level, T1 key, T2 value)
- {
- if(hashNode->occupied == false)
- {
- hashNode->m_key = key;
- hashNode->m_value = value;
- hashNode->occupied = true;
- return;
- }
-
- int index = key%Prime[level];
-
- if (hashNode->child[index] == NULL)
- {
- hashNode->child[index] = new HashNode<T1,T2>;
- }
-
- level += 1;
- Insert(hashNode->child[index], level, key, value);
-
- }
-
- template<class T1, class T2>
- bool HashTree<T1,T2>::FindNode(T1 key, T2 &value)
- {
- return Find(root, 0, key, value);
- }
-
- template<class T1, class T2>
- bool HashTree<T1,T2>::Find(HashNode<T1,T2> *hashNode, int level, T1 key, T2 value)
- {
- if (hashNode->occupied == true)
- {
- if (hashNode->m_key == key)
- {
- value = hashNode->m_value;
- return true;
- }
- }
-
- int index = key%Prime[level];
- if (hashNode->child[index] == NULL)
- {
- return false;
- }
-
- level += 1;
- return Find(hashNode->child[index], level, key, value);
- }
-
- template<class T1, class T2>
- void HashTree<T1,T2>::DeleteNode(T1 key)
- {
- Delete(root, 0, key);
- }
-
- template<class T1, class T2>
- void HashTree<T1,T2>::Delete(HashNode<T1,T2> *hashNode, int level, T1 key)
- {
- if (hashNode->occupied == true)
- {
- if (hashNode->m_key == key)
- {
- hashNode->occupied = false;
- cout << "关键字为" << key << "结点已被删除!" << endl;
- return;
- }
- }
-
- int index = key%Prime[level];
- if (hashNode->child[index] == NULL)
- {
- cout << "该关键字不存在!" << endl;
- return;
- }
-
- level += 1;
- Delete(hashNode->child[index], level, key);
- }
-
- int _tmain(int argc, _TCHAR* argv[])
- {
- HashTree<int, int> ht;
- ht.InsertNode(1, 8);
- ht.InsertNode(2, 0);
- ht.InsertNode(3, 4);
- ht.InsertNode(4, 7);
- ht.InsertNode(5, 4);
- ht.InsertNode(6, 3);
- ht.InsertNode(7, 8);
-
- int nvalue = 0;
- cout << ht.FindNode(5,nvalue) << endl;
- cout << ht.FindNode(9,nvalue) << endl;
-
- ht.DeleteNode(4);
- ht.DeleteNode(10);
-
- cout<<"baasdfas"<<endl;
- system("pause");
- return 0;
- }