哈希函数和哈希表(散列表)

哈希表的简单介绍:哈希表是一种实现字典操作的一种有效的数据结构,它是普通数组概念的推广,由于对普通数组可以直接寻址,使得其的查找的时间复杂度是始终为O(1)的。

一、哈希函数:

若一个函数为哈希函数其必然具有以下四个性质:
①输入域无穷但对用的输出域是相对有限的
②若输入确定,输出一定确定
③输出相同,但输入并不一定相同,也就是输出不同,输入可能相同:哈希碰撞
④其具有离散性。也就是每个输出数的概率是几乎相同的,也就是在整个s域上是几乎均匀分布的。(其均衡性性越好,离散性越高,其哈希函数的性能也就越优良)
作用:是用来打乱输入规律的,他的变换过程很复杂,但是是非随机的,满足②③性质input(输入) -> code(哈希值,均匀分布) -> %M(对M取余) -> 0 - M-1(得到一个0 - M-1的区间)在input很大时,M较小时,我们得到的0 - M-1的区间对应的每一个数也几乎均匀分布

 

二、哈希表

 

输入域通过哈希函数得到一个输出域,把输出域对M进行取余之后得到一个长度为M的数组,这个数组的每个位置都叫做一个位桶,每个位桶都是几乎均匀分布的,我们用链表来当做每个位桶的数据结构,但是当链表的长度达到一定的时候,我们认为就不经济了,因为查询或者其它操作的时候消耗的资源很大,我们就会成倍的扩充数组,并重新计算哈希函数,我们可以认为他的额外的空间复杂度为O(n),但因为扩容是可以离线的,扩充也没有这么频繁,因此我们认为,在查询的时候的时间复杂度是可以做到O(1)的,在java中实现这种数据结构的很多,经典的就是HashSet和HashMap,因为链表我们认为当它在长度超过一定范围慢了,在jdk1.8之后,位桶的长度大于8的时候,我们采用红黑树来替代链表这种数据结构。HashSet和HashMap其实都是一样的(其实都是选择的拉链法去解决的哈希冲突),不同的是,HashSet在每个位桶所对应的数据上,只有key,而HashMap在每个key上又挂了一个value,也就是HashSet的add(key)方法,和HashMap的put(key,value)方法,HashSet可以根据这个key看是否有这个key,HashMap可以根据key去拿这个value(我们可以认为使用哈希表这种数据结构的增删改查时间复杂都为O(1)的操作,但是常数项比较大,因为哈希函数再计算的时候代价比较高)

对于哈希表这种数据结构,对每个关键字去映射到一个位桶里,因为位桶的数目远小于关键字的数目,所以肯定会产生两个输入域的关键字会映射到同一个位桶里,即哈希冲突,如何解决哈希冲突,请看下一篇帖子。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值