字符串哈希值

字符串哈希值

使用另一种进制来表示字符串,在该进制表示下的字符串的值即为哈希值。

包含小写字母的字符串,只有26中可能性,可以使用27进制。

自己设定:在26进制下a=1,b=2,c=3..............z=26

那么字符串 "a"的哈希值=1 ,“aa”的哈希值=28。

反之哈希值=1的字符串是 “a”,  哈希值=28 的字符串是“aa”。

哈希值与字符串一一对应。

 

如何计算哈希值:

前 i 个字符的哈希值为hash[i]

第i位的权值为 27^{i}

 

比如一个字符串   "abaab"

自己设定:27进制表示下,a=1 ,b=2 ,  c=3 ...........

 012345
字符串 a   baab
hash:0  0*27+1=11*27+2=2929*27+1=784784*27+1=2114221142*27+2=570836
value:127^{1}27^{2}27^{3}27^{4}27^{5}

 

通过计算得以上的hash之后,就可以求出任意子串的hash了。

比如求子串 [2,3] -  “ba”    的哈希值,  哈希值 = hash[3] -hash[1]*value[3-1] =784-1*27^{2}=55  (验证:"ba"在27进制下表示为 21_{27}=2*27+1=55 )

hash[3]表示前3个字符的哈希值。

hash[1]表示前1个字符的哈希值

hash[1]*value[3-1]就是直接从i=1到达i=3而不加上第2,3位的值,所以 hash[3] 和  hash[1]*value[3-1] 差值就是未被加上的子串[2,3]的哈希值.

 

所以求子串 [ l , r ]  哈希值即是:hash[r]  -  hash[l-1]  *  value[r-l+1]

#include<bits/stdc++.h>
using namespace std;
typedef unsigned long long ull; 
void GetHash(string& s,ull hash[],ull value[]){
	const int MOD=27;
	value[0]=1;
	hash[0]=0;
	for(int i=0;i<s.length();i++){
		hash[i+1]=hash[i]*MOD+(s[i]-'a'+1);
		value[i+1]=value[i]*MOD;
	}
}
int main()
{
	string s;
	ull hash[100005],value[100005];
	cin>>s;
	GetHash(s,hash,value);
	cout<<hash[s.length()]-hash[0]*hash[s.length()]<<endl;
	return 0;
}

 

注意:

代码中使用里unsigned long long 类型,可以实现一些效果:

计算出来的哈希值往往过大,unsigned long long 是定点类型里范围最大的,而且溢出是可以自动对2^{63}取模。

第二个作用:hash[r]  -  hash[l-1]  *  value[r-l+1]  , 由于在取模意义下做减法可能会出现负数,unsigned long long 是无符号类型,负数即是负溢出,负溢出时同样自动对2^{63}取模。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值