Hash Table 的原理及实现

原理

       哈希表,也叫散列表。是一种用于查找的基本的数据结构。
说起查找,我们常见的有顺序查找、二分查找,这两者都是基于关键码的比较

  • 顺序检索 == !=
  • 二分法、树型 >, ==, <

       当问题规模 n 很大时,上述检索的时间效率可能使用户无法接受。
最理想的情况

  • 根据关键码值,直接找到记录的存储地址
  • 不需要把待查关键码与候选记录集合的某些记录进行逐个比较

       因此,为了解决这一问题,由数组的直接寻址想到散列。

概念

哈希存储时由一个确定的函数 h 计算存储位置

  • 以结点的关键码 k 为自变量
  • 函数值 h(k) 作为结点的存储地址

检索时也是根据这个函数计算存储位置
介绍几个重要概念:

  • 负载因子 a = n / m
    • 散列表的空间大小为 n
    • 填入表中的结点数为 m

       负载因子一般来数不能太大,小于 0.5

  • 冲突
    • 某个散列函数对于不相等的关键码计算出了相同的散列地址
    • 实际应用中,不产生冲突的散列是不存在的
  • 同义词
    • 发生冲突的两个关键字

散列函数

  • 作用: 把关键码映射到存储位置的函数
  • 常见散列函数
    • 除留余数法:取关键字被某个不大于散列表表长m的数p除后所得的余数为散列地址。
    • 直接定址法:取关键字或关键字的某个线性函数值为散列地址。
    • 数字分析法:假设关键字是以r为基的数,并且哈希表中可能出现的关键字都是事先知道的,则可取关键字的若干数位组成哈希地址。
    • 平方取中法:取关键字平方后的中间几位为哈希地址
    • 折叠法:将关键字分割成位数相同的几部分(最后一部分的位数可以不同),然后取这几部分的叠加和(舍去进位)作为哈希地址。

冲突处理

        为了知道冲突产生的相同散列函数地址所对应的关键字,必须选用另外的散列函数,或者对冲突结果进行处理。而不发生冲突的可能性是非常之小的,所以通常对冲突进行处理。常用方法有以下几种:

  • 开放定址法
    在这里插入图片描述

  • 拉链法(单独链表法): 将散列到同一个存储位置的所有元素保存在一个链表中。

实现

标准实现

  • 语言: C 语言
  • 散列函数: 除留余数法
  • 冲突处理:拉链法
/***structure***/
typedef struct hashTableNode {
    int value;
    struct hashTableNode* next;
}hashTableNode;

typedef struct hashTable {
    int size;
    struct hashTableNode** data;
}hashTable;

/***Initialization***/
hashTable* initHashTable(int size) {
    hashTable* h = (hashTable* )malloc(sizeof(hashTable));
    h->size = size << 1;
    h->data = (hashTableNode** )calloc(sizeof(hashTableNode** ), h->size);

    return h;
}

hashTableNode* initHashTableNode(hashTableNode* h, int k) {
    hashTableNode* p = (hashTableNode* )malloc(sizeof(hashTableNode));
    p->value = k;
    p->next = h;
    
    return p;
}

/***Insert***/
void hashTableInsert(hashTable* h, int k) {
    int key = abs(k) % h->size;
    h->data[key] = initHashTableNode(h->data[key], k);
}

/***Search***/
bool hashTableSearch(hashTable* h, int k) {
    int key = abs(k) % h->size;
    hashTableNode* p = h->data[key];
    while(p && (p->value != k)) p = p->next;

    return p != NULL;
}

直接利用数组索引

当数据范围比较小的时候,可以直接利用数组索引进行映射。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值