哈希表

最新推荐文章于 2023-04-29 21:00:42 发布

wwj_zy

最新推荐文章于 2023-04-29 21:00:42 发布

阅读量753

点赞数

分类专栏：算法与数据结构

算法与数据结构专栏收录该内容

111 篇文章 1 订阅

订阅专栏

一、基本概念

散列技术：在记录的存储位置和它的关键字之间建立一个确定的对应关系f，使得每个关键字key对应一个存储位置f(key)。

f：散列函数/哈希函数；
采用散列技术将记录存储在一块连续的存储空间中，这块连续存储空间称为散列表或哈希表。
关键字对应的记录存储位置称为散列地址。

散列技术既是一种存储方法，也是一种查找方法。
散列技术适合求解问题是查找与给定值相等的记录。查找速度快。
散列技术不适合范围查找，不适合查找同样关键字的记录，不适合获取记录的排序，最值。

冲突：关键字key1不等于key2，但f(key1)=f(key2)。
把key1和key2称为散列函数的同义词。

二、散列函数构造

两个原则：

计算简单
散列地址分布均匀

1. 直接定址发

f(key)=a x key+b(a、b为常数)

简单，均匀，不会冲突，但是事先知道关键字的分布情况，适合查找表小且连续。

2. 数字分析法

关键字位数多，比如手机号，可能前几位一样，只是后几位不同，抽取关键字的一部分计算散列存储位置。事先知道关键字分布且若干位分布均匀。
这里写图片描述

3. 平方取中法

不知道关键字分布，且位数不是很大。1234，平方1522756，抽取中间227作为散列地址。

4. 折叠法

不知道关键字分布，位数多。
从左到右分割成位数相等的几部分，这几部分叠加求和，并按散列表表长，取后几位作为散列地址。

5. 除留余数法

散列表长m

f(key)=key mod p(p<=m)

p选取不好，产生冲突。
通常p为<=m（最好接近m）的最小质数或者不包含小于20质因子的合数。

6. 随机数法

关键字长度不等。

f(key)=random(key),random随机函数

当关键字为字符串，转化为某种数字来对待，比如ASCLL码或者Unicode码等。

三、散列冲突处理

1. 开放定址法

又叫线性探测法：一旦冲突，寻找下一个空的散列地址。散列表大。
这里写图片描述

优化：二次探测法
这里写图片描述
双向寻找，防止后面没空，但前面有空。
增加平方，不让关键字聚集在某一块区域。

还有对位移量d随机函数计算，称之为随机探测法。

2. 再散列函数法

这里写图片描述
RHi不同散列函数，随机使用除留、折叠、平方，每次冲突换种散列函数。

3. 链地址法

将所有关键字为同义词的记录存储在一个单链表（同义词字表）中。
散列表中只存储所有同义词字表的头指针。
{12,67,56,16,25,37,22,29,15,47,48,34} mod 12
这里写图片描述

缺点：单链表查找遍历耗时。

4. 公共溢出区法

冲突关键字存储到溢出表中
这里写图片描述
散列计算后，先基本表比较。不等，到溢出表进行顺序查找。

四、散列表查找

1. 附加源码

<code class="language-c hljs  has-numbering"><span class="hljs-preprocessor">#include "stdio.h"    </span>
<span class="hljs-preprocessor">#include "stdlib.h"   </span>
<span class="hljs-preprocessor">#include "io.h"  </span>
<span class="hljs-preprocessor">#include "math.h"  </span>
<span class="hljs-preprocessor">#include "time.h"</span>

<span class="hljs-preprocessor">#define OK 1</span>
<span class="hljs-preprocessor">#define ERROR 0</span>
<span class="hljs-preprocessor">#define TRUE 1</span>
<span class="hljs-preprocessor">#define FALSE 0</span>

<span class="hljs-preprocessor">#define MAXSIZE 100 /* 存储空间初始分配量 */</span>

<span class="hljs-preprocessor">#define SUCCESS 1</span>
<span class="hljs-preprocessor">#define UNSUCCESS 0</span>
<span class="hljs-preprocessor">#define HASHSIZE 12 /* 定义散列表长为数组的长度 */</span>
<span class="hljs-preprocessor">#define NULLKEY -32768 </span>

<span class="hljs-keyword">typedef</span> <span class="hljs-keyword">int</span> Status; <span class="hljs-comment">/* Status是函数的类型,其值是函数结果状态代码，如OK等 */</span> 

<span class="hljs-keyword">typedef</span> <span class="hljs-keyword">struct</span>
{
   <span class="hljs-keyword">int</span> *elem; <span class="hljs-comment">/* 数据元素存储基址，动态分配数组 */</span>
   <span class="hljs-keyword">int</span> count; <span class="hljs-comment">/*  当前数据元素个数 */</span>
}HashTable;

<span class="hljs-keyword">int</span> m=<span class="hljs-number">0</span>; <span class="hljs-comment">/* 散列表表长，全局变量 */</span>

<span class="hljs-comment">/* 初始化散列表 */</span>
Status InitHashTable(HashTable *H)
{
    <span class="hljs-keyword">int</span> i;
    m=HASHSIZE;
    H->count=m;
    H->elem=(<span class="hljs-keyword">int</span> *)<span class="hljs-built_in">malloc</span>(m*<span class="hljs-keyword">sizeof</span>(<span class="hljs-keyword">int</span>));
    <span class="hljs-keyword">for</span>(i=<span class="hljs-number">0</span>;i<m;i++)
        H->elem[i]=NULLKEY; 
    <span class="hljs-keyword">return</span> OK;
}

<span class="hljs-comment">/* 散列函数 */</span>
<span class="hljs-keyword">int</span> Hash(<span class="hljs-keyword">int</span> key)
{
    <span class="hljs-keyword">return</span> key % m; <span class="hljs-comment">/* 除留余数法 */</span>
}

<span class="hljs-comment">/* 插入关键字进散列表 */</span>
<span class="hljs-keyword">void</span> InsertHash(HashTable *H,<span class="hljs-keyword">int</span> key)
{
    <span class="hljs-keyword">int</span> addr = Hash(key); <span class="hljs-comment">/* 求散列地址 */</span>
    <span class="hljs-keyword">while</span> (H->elem[addr] != NULLKEY) <span class="hljs-comment">/* 如果不为空，则冲突 */</span>
    {
        addr = (addr+<span class="hljs-number">1</span>) % m; <span class="hljs-comment">/* 开放定址法的线性探测 */</span>
    }
    H->elem[addr] = key; <span class="hljs-comment">/* 直到有空位后插入关键字 */</span>
}

<span class="hljs-comment">/* 散列表查找关键字 */</span>
Status SearchHash(HashTable H,<span class="hljs-keyword">int</span> key,<span class="hljs-keyword">int</span> *addr)
{
    *addr = Hash(key);  <span class="hljs-comment">/* 求散列地址 */</span>
    <span class="hljs-keyword">while</span>(H.elem[*addr] != key) <span class="hljs-comment">/* 如果不为空，则冲突 */</span>
    {
        *addr = (*addr+<span class="hljs-number">1</span>) % m; <span class="hljs-comment">/* 开放定址法的线性探测 */</span>
        <span class="hljs-keyword">if</span> (H.elem[*addr] == NULLKEY || *addr == Hash(key)) <span class="hljs-comment">/* 如果循环回到原点 */</span>
            <span class="hljs-keyword">return</span> UNSUCCESS;   <span class="hljs-comment">/* 则说明关键字不存在 */</span>
    }
    <span class="hljs-keyword">return</span> SUCCESS;
}

<span class="hljs-keyword">int</span> main()
{
    <span class="hljs-keyword">int</span> arr[HASHSIZE]={<span class="hljs-number">12</span>,<span class="hljs-number">67</span>,<span class="hljs-number">56</span>,<span class="hljs-number">16</span>,<span class="hljs-number">25</span>,<span class="hljs-number">37</span>,<span class="hljs-number">22</span>,<span class="hljs-number">29</span>,<span class="hljs-number">15</span>,<span class="hljs-number">47</span>,<span class="hljs-number">48</span>,<span class="hljs-number">34</span>};
    <span class="hljs-keyword">int</span> i,p,key,result;
    HashTable H;

    key=<span class="hljs-number">39</span>;

    InitHashTable(&H);
    <span class="hljs-keyword">for</span>(i=<span class="hljs-number">0</span>;i<m;i++)
         InsertHash(&H,arr[i]);

    result=SearchHash(H,key,&p);
    <span class="hljs-keyword">if</span> (result)
        <span class="hljs-built_in">printf</span>(<span class="hljs-string">"查找 %d 的地址为：%d \n"</span>,key,p);
    <span class="hljs-keyword">else</span>
        <span class="hljs-built_in">printf</span>(<span class="hljs-string">"查找 %d 失败。\n"</span>,key);

    <span class="hljs-keyword">for</span>(i=<span class="hljs-number">0</span>;i<m;i++)
    {
        key=arr[i];
        SearchHash(H,key,&p);
        <span class="hljs-built_in">printf</span>(<span class="hljs-string">"查找 %d 的地址为：%d \n"</span>,key,p);
    }

    <span class="hljs-keyword">return</span> <span class="hljs-number">0</span>;
}
</code>