散列查找

散列查找不同于其他的查找找一个元素要遍历很多东西,散列查找是尽量给每个元素都找到他所特有的一个特点(构建散列函数关系),然后找的时候只需要找其特点就行,不需要遍历,所以比其他的查找效率要高很多,适用于大量数据,当其他查找难以解决时就用到它,并且可用于字符串,我们将字符串赋值,然后同样当成一串数字处理。

散列表

散列表是用来存元素数据的容器,他的标志就是这些元素的特点,查找时,在直接找到散列表中的对应位置,他的操作主要就是插入删除查找。
插入只要能插入的位置是空的就能插入(但是一定要按顺序,否则解决冲突后元素所在位置与函数得出位置不同)
删除就不能直接删除了,因为删除后如果有元素与其会冲突就会把这个位置看成空的,就插入进去了,所以我们通常用个标记flag,删除就把它的标记值给改变。
在这里插入图片描述

散列函数

散列函数的构造是关键,因为散列查找的效率高不高完全取决于散列函数,当然散列函数都是各有各的好处,因此我们在选择使用的散列函数时应该具体情况具体分析,选择最合适的散列函数。在构建散列函数时有两个关键点,1.计算简单 2.尽量避免冲突,让每个元素都是独特的。
常见的构造散列函数的方法有:
1.直接定址法:简单的直接定义能包含所有元素的一个区间,依此把它们放进去,这样虽然计算简单,但是效率不高。
2.除留余数法:我们可以对元素的数值进行一个特殊的取余,可以尽量让他们不冲突,详情可参考哈希字符串,但是这样还是会有较多冲突。
3.数字分析法:我们可以观察数据,然后取几位关键的数据来进行函数处理(例如身份证上的数据代表着不同的信息,我们可以取几个关键的数字)。
4.数字折叠法:把数字拆成相同的几部分,然后叠加起来
5.平方取中法:把数字平方计算,取平方后的数字的中间几位数。
但是这些方法都容易冲突,所以我们对元素原本的代表的数字入手进行改进(我理解的就是把数字放大,减少冲突可能性)
在这里插入图片描述

冲突处理方法

大体分为两类,开放地址法和链地址法;
开放地址法:在这里插入图片描述
1.线性探测:当这个元素第一次冲突时,就把它往后移1个单位,如果可以就插入,否则这个元素第二次冲突就移动两个单位,到边界范围就往从头部开始,直到找到合适位置。这样简单,但是他会有严重的聚集现象,因为这里冲突了之后,后面再冲突的元素连续冲突的次数会变多,就使得这个查找的效率降低。
2.平方探测:第一次冲突了就到±1平方的位置,再冲突就到±2的位置,这样跳来跳去可以降低聚集现象,但是有可能跳来跳去都找不到合适的位置。
3.双散列:散列函数里面再嵌套一个散列函数,当冲突就进行里面散列函数的计算,就能有效的解决冲突问题。
4.再散列:扩大散列表来解决散列系数大的问题
链地址法:就是在冲突时,就把散列表的该位置建一个链表,把冲突的元素按照顺序链接起来在这里插入图片描述

散列表的性能分析

这就是对散列表的效率进行计算分析,这个计算通常要分为两部分,一个是能在散列表找到的元素查找的平均次数,另一个就是找不到的元素查找的平均次数;第一个很容易计算,第二种也就是把不能找到的分下类,让后用个别例子计算。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值