题意:
给你两个字符串,求最长的公共子序列
错误思路;
直接KMP求解,而 KMP算法是用于看一个串是否为另一个串的子串,这道题如果枚举子串,每个都求next数组再匹配时间复杂度是O(n^2)
所以求公共子串长度最好不要用KMP
由于数据很大,直接慢慢找最长长度肯定会超时,因此需要优化(二分答案)
方法:hash + 二分答案
注意:
用STL的map,set存hash值会超时
#include<iostream>
#include<algorithm>
#include<string>
#include<cstring>
#include<queue>
#include<map>
#include<vector>
#include<set>
#include<cstdio>
#include<cstring>
#define IOS ios::sync_with_stdio(false),cin.tie(0),cout.tie(0)
typedef long long ll;
using namespace std;
const int maxn = 100005;
char str1[maxn],str2[maxn];
ll hash1[maxn],hash2[maxn];
ll power[maxn];
const int p = 131;
vector <ll> vll; // 长度为 N 的所有子串的hash
int len1,len2;
bool check(int mid) // 看两个字符串的公共子串长度为mid是否可行
{
vll.clear();
for(int i = 1 ; i + mid - 1 <= len1 ; i++){
int l = i , r = mid + i - 1;
vll.push_back(hash1[r] - hash1[l - 1] * power[r - l + 1]);
}
sort(vll.begin(),vll.end());
for(int i = 1 ; i + mid - 1 <= len2 ; i++){
int l = i,r = mid + i - 1;
ll tmp = hash2[r] - hash2[l - 1] * power[r - l + 1];
if(binary_search(vll.begin(),vll.end(),tmp)) return true;
}
return false;
}
void solve()
{
int l = 0,r = min(len1,len2);
while(l < r){
int mid = l + r + 1 >> 1;
if(check(mid)) l = mid;
else r = mid - 1;
}
cout << l << endl;
}
int main(){
IOS;
scanf("%s%s",str1 + 1,str2 + 1);
power[0] = 1;
len1 = strlen(str1 + 1);
len2 = strlen(str2 + 1);
for(int i = 1 ; i <= len1 ; i++){
hash1[i] = hash1[i - 1] * p + str1[i] ;
power[i] = power[i - 1] * p;
}
for(int i = 1 ; i <= len2 ; i++) hash2[i] = hash2[i - 1] * p + str2[i];
solve();
return 0;
}