【JZOJ5462】好文章【哈希】

题目大意:

题目链接:https://jzoj.net/senior/#main/show/5462
题目图片:
http://wx4.sinaimg.cn/mw690/0060lm7Tly1fwena030iwj30j70ba74m.jpg
http://wx2.sinaimg.cn/mw690/0060lm7Tly1fwena02ec5j30ja0eb74j.jpg
给出一个长度为 n n n的小写字母组成的字符串,求其中有几个不同的(断句)长度为 m m m的子串。


思路:

50分做法:

1 ≤ m ≤ n ≤ 2000 1≤m≤n≤2000 1mn2000
枚举子串开始的位置,再将接下来的 m m m位扔进 T r i e Trie Trie里,记录答案即可。
时间复杂度 O ( n 2 l o g ) O(n^2log) O(n2log)
代码

100分做法:

1 ≤ m ≤ n ≤ 200000 1≤m≤n≤200000 1mn200000
字符串 H A S H HASH HASH
这道题很诡异的卡单哈希,所以得用双哈希。
我们假设有一个字符串是这样的:

  • c [ ] = i a m j u r u o c[]=iamjuruo c[]=iamjuruo

那么我们可以取出它前面的 i i i位。

  • s [ 1 ] = c [ 1 ] = i s[1]=c[1]=i s[1]=c[1]=i
  • s [ 2 ] = s [ 1 ] + c [ 2 ] = i a s[2]=s[1]+c[2]=ia s[2]=s[1]+c[2]=ia
  • s [ 3 ] = s [ 2 ] + c [ 3 ] = i a m s[3]=s[2]+c[3]=iam s[3]=s[2]+c[3]=iam
  • s [ 4 ] = s [ 3 ] + c [ 4 ] = i a m j s[4]=s[3]+c[4]=iamj s[4]=s[3]+c[4]=iamj
  • . . . . . . ...... ......
  • s [ 8 ] = s [ 7 ] + c [ 8 ] = i a m j u r u o s[8]=s[7]+c[8]=iamjuruo s[8]=s[7]+c[8]=iamjuruo

那么如果我们呢要取出这个字符串的第 l l l r r r位,那么应该怎么取呢?
我们假设这个字符串是一个十进制数字。

  • c [ ] = 12345678 c[]=12345678 c[]=12345678
  • s [ 1 ] = 1 s[1]=1 s[1]=1
  • s [ 2 ] = 12 s[2]=12 s[2]=12
  • s [ 3 ] = 123 s[3]=123 s[3]=123
  • . . . . . . ...... ......
  • s [ 8 ] = 12345678 s[8]=12345678 s[8]=12345678

那么如果我们要取出这个数字串的第 3 3 3 6 6 6位,那么自然就是:
a n s = s [ 6 ] − s [ 3 − 1 ] × 1 0 6 − ( 3 − 1 ) ans=s[6]-s[3-1]\times 10^{6-(3-1)} ans=s[6]s[31]×106(31)
那么我们可以进一步得到,如果我们要取出这个字符串的第 l l l r r r位,那么就是
a n s = s [ r ] − s [ l − 1 ] × 1 0 r − ( l − 1 ) ans=s[r]-s[l-1]\times 10^{r-(l-1)} ans=s[r]s[l1]×10r(l1)
所以,如果我们把这个字符串看成一个BASE进制的数字串,就可以按照上述公式求第 l l l r r r位。
那么就有:
a n s = s [ r ] − s [ l − 1 ] × B A S E   r − ( l − 1 ) ans=s[r]-s[l-1]\times BASE^{\ r-(l-1)} ans=s[r]s[l1]×BASE r(l1)
所以,哈希就可以这样用了。
时间复杂度: O ( n l o g ) O(nlog) O(nlog)


代码:

#include <cstdio>
#include <cstring>
#include <map>
#include <iostream>
#define MOD1 290182597
#define MOD2 163227661
#define BASE1 3769
#define BASE2 9439
#define N 200100
#define ll long long
#define mp make_pair
using namespace std;

int n,m,pow1[N],pow2[N],hash1[N],hash2[N],ans;
char c[N];
map<pair<int,int>,int> p;

ll find1(int l,int r)
{
	return (hash1[r]-(ll)hash1[l-1]*pow1[r-l+1]%MOD1+MOD1)%MOD1;   //上述公式
}

ll find2(int l,int r)
{
	return (hash2[r]-(ll)hash2[l-1]*pow2[r-l+1]%MOD2+MOD2)%MOD2; 
}

int main()
{
	scanf("%d%d",&n,&m);
	cin>>c+1;
	pow1[0]=1;
	pow2[0]=1;
	for (int i=1;i<=n;i++)
	{
		pow1[i]=((ll)pow1[i-1]*BASE1)%MOD1;
		pow2[i]=((ll)pow2[i-1]*BASE2)%MOD2;  //取出BASE的x次方
		hash1[i]=((ll)hash1[i-1]*BASE1%MOD1+c[i]-'a'+1)%MOD1;
		hash2[i]=((ll)hash2[i-1]*BASE2%MOD2+c[i]-'a'+1)%MOD2;  //HASH函数
	}
	ll x,y;
	for (int i=1;i<=n-m+1;i++)
	{
		x=find1(i,i+m-1);
		y=find2(i,i+m-1);
		if (!p[mp(x,y)]) ans++;  //没有出现过
		p[mp(x,y)]=1;
	}
	printf("%d\n",ans);
	return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值