什么是hash表
hash法,hash表,散列法是一个东西。
hash表是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。用于映射的函数叫做散列函数。
若关键字为k,则其值存放在f(k)的存储位置上。由此,不需比较便可直接取得所查记录。称这个对应关系f为散列函数,按这个思想建立的表为散列表。
代码
使用STL容器vector实现hash表
vector<vector<vector<int*>*>*>* V = new vector<vector<vector<int*>*>*>[10];
for (int i = 0; i < 10; i++)
{
V[i].push_back(new vector<vector<int*>*>[10]);
for (int j = 0; j < 10; j++)
{
V[i][j]->push_back(new vector<int*>);
for(int k = 0;k<10;k++)
{
V[i][j][k] = new 链表; //当然也可以是数组,能存数据就行
}
}
}
如下图,上述代码创建了10×10×10个链表,而这里图片中只展示了其中一种。
分析
- 这里我们设计了10×10×10个链表用来存储数据,而这每一个链表都是能够通过特定值找到的。比如这里,第一层4,第二层5,第三层6,vector[4][5][6]就对应了这个链表。456就可以做为key,设计的散列函数f得到数据。
- 由于是一一对应映射的关系(通过指针),能够非常快速地获取到所需的数据。
- 设计合理的算法才能避免冲突,比如,图中的key为456对应了这个链表,但往往数据量是庞大,这个链表不可能只存一个数,1456也作为了代表链表的第二个节点的key存储,这时f(456)==f(1456),虽然它们key不一样,却对应同一个链表,还有2456、3456…(取决于你的散列函数怎么写)。那为什么不设计更多层的vector?当然可以,只要能避免冲突就行,同时还要便于管理,这里整个链表的数据可以看做是同一类的。