算法笔记——字符串哈希

一.字符串哈希概述

字符串哈希,即得到一个字符串的哈希值。

最常见的字符串哈希函数:

将字符串转化为特定进制数并自然溢出,一般进制数最好是>300的质数。

转化时每位从1开始,假设一个字符串只有小写字符和数字组成(a~z->1~26,0~9->27~37)。

哈希碰撞(不同字符的哈希值相同)理论上是会发生的,但是概率很低,忽略不计。

二.快速得到一个字符任意子串的哈希值

其思想很类似于前缀和,可以类比学习。

假设进制位base,当前字符s,

hash数组:hash[i]记录字符串第i位结尾的子串的哈希值,

pow数组:pow[i]记录base的i次幂。

1.得到在base的所有次方,自然溢出,储存在pow数组

2.hash[i] = hash[i-1] * base + s[i]-'a'+1;

3.hash[l……r] = hash[r] - hash[l-1] * pow[r-l+1];(hash[l……r] 是(l,r)子串的哈希值)

三.应用

可以大大简化一些复杂字符串算法。

比如使用字符串哈希就可以完全替代KMP算法,而且代码简单很好理解。

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
字符串匹配算法是一种用来查找一个字符串(即目标串)在另一个字符串(即模式串)中的出现位置的算法。其中,KMP算法是一种比较常用的字符串匹配算法。 KMP算法的核心思想是通过利用模式串中已经匹配过的信息,来尽量减少目标串和模式串的比较次数,从而提高匹配效率。它利用一个最长公共前缀和最长公共后缀数组,记录模式串中已经匹配成功的前缀和后缀的长度。通过根据这些信息来移动模式串的位置,避免不必要的比较。 而字符串哈希算法是一种将字符串映射为一个较短的固定长度的数值的算法。通过对字符串的每个字符进行一系列运算,如求幂、取模等,最终得到一个哈希值。这个哈希值可以代表该字符串的特征,不同字符串哈希值一般不会相同。 字符串哈希算法的主要作用是将字符串转化为一个定长的数字,方便在数据结构中进行比较和存储。在字符串匹配中,使用哈希算法可以将目标串和模式串转换为哈希值,然后比较哈希值是否相等来判断是否匹配。由于比较哈希值的时间复杂度较低,使用字符串哈希算法可以提高匹配效率。 总的来说,字符串匹配算法字符串哈希算法都是用来处理字符串匹配的问题。KMP算法通过利用已知信息来减少比较次数,提高匹配效率;而字符串哈希算法则是将字符串转化为哈希值,便于进行比较和存储。两者都在一定程度上提高了字符串匹配的效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值