哈希表中线性探测再散列法及等概率条件下平均查找长度

最近复习了下数据结构中的哈希表,发现在计算等概率情况下查找不成功的平均查找长度时比较迷茫,不知道到底是怎么计算出来的。现在通过查阅资料终于知道如何计算了,所以记录下来以供以后查阅。

   下面看下2010年2010年全国硕士研究生入学统一考试计算机科学与技术学科联考计算机学科专业基础综合试题中一个考哈希表的题。

Question1:

将关键字序列(7、8、30、11、18、9、14)散列存储到散列表中。散列表的存储空间是一个下标从0开始的一维数组,散列函数为:      H(key) = (keyx3) MOD 7,处理冲突采用线性探测再散列法,要求装填(载)因子为0.7。

(1) 请画出所构造的散列表。

(2) 分别计算等概率情况下查找成功和查找不成功的平均查找长度。

Ans:

(1).首先明确一个概念装载因子,装载因子是指所有关键子填充哈希表后饱和的程度,它等于 关键字总数/哈希表的长度。 根据题意,我们可以确定哈希表的长度为 L = 7/0.7 = 10;因此此题需要构建的哈希表是下标为0~9的一维数组。根据散列函数可以得到如下散列函数值表。

H(Key) = (keyx3) MOD 7, 例如key=7时, H(7) = (7x3)%7 = 21%7=0,其他关键字同理。

Key78301118914
H(Key)0365560

(表1)

采用线性探测再散列法处理冲突,所构造的散列表为:

地址0123456789
关键字714 8 1130189 

(表2)

下面对散列表的构造方式加以说明,注意表1中的关键字7和14,30和9, 11和18,这三组关键子的H(Key)值相同,这在构建散列表时就会产生冲突,因为他们的地址相同,所以要通过一定的冲突处理方法来解决这个问题。依题,采用线性探测再散列法处理冲突。下面详细介绍如何构建散列表:

       第一个key 7,它的地址是0,因此放到散列表的数组下表为0的位置,这个位置上没有关键字,因此没有冲突可以直接填入;

       第二个key 8,它的地址是3,因此放到散列表的数组下表为3的位置,这个位置上没有关键字,因此没有冲突可以直接填入;

       第三个key 30,它的地址是6,因此放到散列表的数组下表为6的位置,这个位置上没有关键字,因此没有冲突可以直接填入;

       第四个key 11,它的地址是5,因此放到散列表的数组下表为5的位置,这个位置上没有关键字,因此没有冲突可以直接填入;

       第五个key 18,它的地址是5,因此放到散列表的数组下表为5的位置,但这个位置上已经有关键字11,遇到了冲突,此时我们根据线性探测再散列法来处理这个冲突,探测下一个位置6, 6这个位置上已经存在关键字30则继续增加步长1,因此现在的新地址应为7,位置7上没有关键字,放入即可,到此冲突已经解决;

       第六个key 9,它的地址是6,因此放到散列表的数组下表为6的位置,但这个位置上已经有关键字30,遇到了冲突,探测下一个位置7, 7这个位置上已经存在关键字18则继续增加步长1,因此现在的新地址应为8,位置8上没有关键字,放入即可;   

       第七个key 14,它的地址是0,因此放到散列表的数组下表为0的位置,但这个位置上已经有关键字7,遇到了冲突,探测下一个位置1, 位置1上没有关键字,放入即可;   

       到这一步所有关键字均已填入,散列表已经构造完成,如表2所示。

(2)等概率情况下查找成功平均查找长度:

        这一问可以根据第一问的构造过程求解:

        key7一次就填入了表中,因此查找次数为1,同理8, 30, 11查找次数均为1; key18 进行了3次放入操作,探测位置分别是5,6,7 ,因此查找次数为3;key9也是3次;key14 进行了两次探测,因此查找次数为2。次数表如表3所示

Key78301118914
Count1111332

(表3)

        所以ASLsuccess= (1+1+1+1+3+3+2)/ 7 = 12/7。  

        等概率情况下查找不成功的平均查找长度:

        接下来讨论不成功的情况, 看表2,计算查找不成功的次数就直接找关键字到第一个地址上关键字为空的距离即可, 但根据哈希函数地址为MOD7,因此初始只可能在0~6的位置。等概率情况下,查找0~6位置查找失败的查找次数为:

   看地址0,到第一个关键字为空的地址2的距离为3,因此查找不成功的次数为3.     

        地址1, 到第一个关键为空的地址2的距离为2,因此查找不成功的次数为2.

        地址2,  到第一个关键为空的地址2的距离为1,因此查找不成功的次数为1.

        地址3,到第一个关键为空的地址4的距离为2,因此查找不成功的次数为2.

        地址4,到第一个关键为空的地址4的距离为1,因此查找不成功的次数为1.

        地址5,到第一个关键为空的地址2(注意不是地址9,因为初始只可能在0~6之间,因此循环回去)的距离为5,因此查找不成功的次数为5.

        地址6,到第一个关键为空的地址2(注意不是地址9,因为初始只可能在0~6之间,因此循环回去)的距离为4,因此查找不成功的次数为4.

        因此查找不成功的次数表如下表所示

Key78301118914
Count3212154

(表4)

       所以ASLunsuccess= (3+2+1+2+1+5+4)/ 7 = 18/7。

 

       以上表述如有不对的地方,欢迎大家指正。谢谢。。。

  • 7
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
对于这个班级的学生姓名,我们可以用拼音表示,例如: zhāng sān, lǐ sì, wáng wǔ, zhào liù, chén qī, ... 接下来,我们需要设计一个哈希表,以学生姓名为关键字。我们可以选择除留余数作为哈希函数,例如: hash(name) = sum(ord(c) for c in name) % 30 其,ord(c) 表示字符 c 的 ASCII 码值,sum 表示求和。这个哈希函数将学生姓名的 ASCII 码值相加,并对 30 取余,得到一个在 到 29 之间的整数,作为该学生在哈希表的位置。 如果两个学生的姓名映射到同一个位置,就会发生冲突。为了处理冲突,我们可以采用线性探测散列。具体来说,如果第 i 个位置已经被占用,就尝试查找第 i+1, i+2, i+3, ... 个位置,直到找到一个空闲位置或者查找次数超过了哈希表的大小。如果查找次数超过了哈希表的大小,就说明哈希表已经满了,需要重新构建。 为了保证平均查找长度上限为 2,我们需要调整哈希表的大小和哈希函数。具体来说,我们可以选择一个质数作为哈希表的大小,例如 31,这样可以保证除留余数的效果更好。同时,我们需要调整哈希函数,使得冲突的概率更小。例如,我们可以将哈希函数改为: hash(name) = (sum(ord(c) for c in name) * 31 + ord(name[])) % 31 其,ord(name[]) 表示姓名的第一个字符的 ASCII 码值,乘以 31 是为了增加随机性。这个哈希函数将学生姓名的 ASCII 码值相加,并乘以 31,再加上姓名的第一个字符的 ASCII 码值,最后对 31 取余,得到一个在 到 30 之间的整数,作为该学生在哈希表的位置。 现在,我们可以按照学生姓名在哈希表查询学生的位置。例如,如果要查询张三的位置,可以计算出 hash("zhāng sān") = 23,然后查找哈希表的第 23 个位置,如果该位置为空,就说明哈希表不存在张三;如果该位置已经被占用,就需要进行线性探测,直到找到张三或者查找次数超过了哈希表的大小。如果查找次数超过了哈希表的大小,就说明哈希表不存在张三。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值