哈希表(Hash Table)/散列表(Key-Value)

哈希表(Hash Table)是一种高效的数据结构,能快速实现查找、插入和删除操作。它通过哈希函数将键映射到存储位置,但冲突是不可避免的。哈希表的实现涉及多种定址和解决冲突的方法,如直接定址法、除法取余法、开放地址法和链地址法等。理解哈希表的冲突解决策略对于优化性能至关重要。
摘要由CSDN通过智能技术生成

  

目录

1. 哈希表的基本思想

2. 哈希表的相关基本概念

  1.概念:

  2.哈希表和哈希函数的标准定义:

  1)冲突:

  2)安全避免冲突的条件:

  3)冲突不可能完全避免

  4)影响冲突的因素

3. 哈希表的实现方法

4. 哈希表“定址”的方法

  1)直接定址法

  2)除法取余法

  3)数字分析法

  4)平方取中法

  5)折叠法

5. 哈希表“解决冲突”的方法

  1)开放地址法  

  2)链地址法

6. 哈希表“定址”和“解决冲突”之间的权衡

7. 哈希表实例


 哈希表(Hash Table)是一种特殊的数据结构,它最大的特点就是可以快速实现查找、插入和删除。因为它独有的特点,Hash表经常被用来解决大数据问题,也因此被广大的程序员所青睐。为了能够更加灵活地使用Hash来提高我们的代码效率,今天,我们就谈一谈Hash的那点事。

1. 哈希表的基本思想

  我们知道,数组的最大特点就是:寻址容易,插入和删除困难;而链表正好相反,寻址困难,而插入和删除操作容易。那么如果能够结合两者的优点,做出一种寻址、插入和删除操作同样快速容易的数据结构,那该有多好。这就是哈希表创建的基本思想,而实际上哈希表也实现了这样的一个“夙愿”,哈希表就是这样一个集查找、插入和删除操作于一身的数据结构。


2. 哈希表的相关基本概念

  1.概念

  哈希表(Hash Table):也叫散列表,是根据关键码值(Key-Value)直接进行访问的数据结构,也就是我们常用到的map。

  哈希函数:也称为是散列函数,是Hash表的映射函数,它可以把任意长度的输入变换成固定长度的输出,该输出就是哈希值。哈希函数能使对一个数据序列的访问过程变得更加迅速有效,通过哈希函数数据元素能够被很快的进行定位

  2.哈希表和哈希函数的标准定义

  若关键字为k,则其值存放在f(k)的存储位置上。由此,不需比较便可直接取得所查记录。称这个对应关系f为哈希函数,按这个思想建立的表为哈希表。

  设所有可能出现的关键字集合记为U(简称全集)。实际发生(即实际存储)的关键字集合记为K(|K|比|U|小得多)。
  散列方法是使用函数h将U映射到表T[0..m-1]的下标上(m=O(|U|))。这样以U中关键字为自变量,以h为函数的运算结果就是相应结点的存储地址。从而达到在O(1)时间内就可完成查找。
  其中:
  ① h:U→{0,1,2,…,m-1} ,通常称h为哈希函数(Hash Function)。哈希函数h的作用是压缩待处理的下标范围,使待处理的|U|个值减少到m个值,从而降低空间开销。
  ② T为哈希表(Hash Table)。
  ③ h(Ki)(Ki∈U)是关键字为Ki结点存储地址(亦称散列值或散列地址)。
  ④ 将结点按其关键字的哈希地址存储到哈希表中的过程称为散列(Hashing)

  1)冲突:

  两个不同的关键字,由于散列函数值相同,因而被映射到同一表位置上。该现象称为冲突(Collision)或碰撞。发生冲突的两个关键字称为该散列函数的同义词(Synonym)。

  2)安全避免冲突的条件:

  最理想的解决冲突的方法是安全避免冲突。要做到这一点必须满足两个条件:
  ①其一是|U|≤m
  ②其二是选择合适的散列函数。
  这只适用于|U|较小,且关键字均事先已知的情况,此时经过精心设计散列函数h有可能完全避免冲突。

  3)冲突不可能完全避免

  通常情况下,h是一个压缩映像。虽然|K|≤m,但|U|>m,故无论怎样设计h,也不可能完全避免冲突。因此,只能在设计h时尽可能使冲突最少。同时还需要确定解决冲突的方法,使发生冲突的同义词能够存储到表中。

  4)影响冲突的因素

  冲突的频繁程度除了与h相关外,还与表的填满程度相关。
  设m和n分别表示表长和表中填入的结点数,则将α=n/m定义为散列表的装填因子(Load Factor)。α越大,表越满,冲突的机会也越大。通常取α≤1。 


3. 哈希表的实现方法

  我们之前说了,哈希表是一个集查找、插入和删除操作于一身的数据结构。那这么完美的数据结构到底是怎么实现的呢?哈希表有很多种不同的实现方法,为了实现哈希表的创建,这些所有的方法都离不开两个问题——“定址”和“解决冲突”。

  在这里,我们通过详细地介绍哈希表最常用的方法——取余法(定值)+拉链法(解决冲突),来一起窥探一下哈希表强大的优点。

  取余法大家一定不会感觉陌生,就是我们经常说的取余数的操作。

  拉链法是什么&#

  • 7
    点赞
  • 41
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值