HDU 6774 String Distance
标签:dp 序列自动机
题意:
- 给你一个长度为n的A串一个长度为m的B串 (1≤n≤100000,1≤m≤20)
- q次询问 取A串的l到r得到一个子串C
- 可以对C或B进行两种操作,插入一个字符或者删去一个字符
- 问最少操作几次使B=C
思路:
插入操作不会比删除操作更优,这个自己模拟下就能发现,所以我们只考虑删除操作,那么操作的步数就等于B串和C串的长度之和减去两倍的最长公共子序列长度(lcm)
如果直接用dp求C串与B串的lcm,那么单次询问的复杂度就为(m*(l-r+1)),显然是不行的
于是我们就要用到序列自动机了
设置一个dp[30][30]
,表示B串前i个字符匹配A串 lcm长度为j时 lcm最后一个字符对应的最小下标
设置 nxt[N][30]
表示在A串中i到n范围内 字符(j+‘a’)出现的最小下标
虽然这俩维度的含义很抽象,但它就是这么设滴
下面来推到转移方程
若不取B中第i个字符作为lcm时,dp[i][j]=dp[i-1][j]
反之 dp[i][j]=nxt[dp[i-1][j-1]+1][s2[i]-'a']
,在A中i-1到n的范围中取到最先出现的B中第i个字符的最小下标
于是转移方程dp[i][j]=min(dp[i-1][j],nxt[dp[i-1][j-1]+1][s2[i]-'a']);
这题时间卡的很紧,推荐scanf
代码:
#define fst std::ios::sync_with_stdio(false), std::cin.tie(0), std::cout << std::fixed << std::setprecision(20)
#define le "\n"
#define ll long long
#include <bits/stdc++.h>
using namespace std;
const int N=1e5+50;
const int mod=1e9+7;
int dp[30][30];//B串前i个字符匹配A串 lcm长度为j时 lcm最后一个字符对应的最小下标
int nxt[N][30];// 在A串中i到n范围内 字符j出现的最小下标
char s1[N],s2[N];
int main() {
int t; scanf("%d",&t);
int n,m;
while(t--){
scanf("%s%s",s1+1,s2+1);
n=strlen(s1+1),m=strlen(s2+1);
memset(nxt,0x3f,sizeof(nxt));//不初始化会wa 暂时不懂为啥
for(int i=0;i<26;i++) nxt[n+1][i] = n+1;
for(int i = n;i >= 1;i--){
for(int j = 0;j < 26;j++){
nxt[i][j] = nxt[i + 1][j];
}
nxt[i][s1[i] - 'a'] = i;
}
int l,r,q;
scanf("%d",&q);
while(q--){
scanf("%d%d",&l,&r);
int lcs = 0;
for(int i = 0;i <= m;i++) {
dp[i][0] = l - 1;//lcm大小为0时 将最早出现的下标设为l-1
for(int j = 1;j <= m;j++) {
dp[i][j] = n + 1; //初始化dp
}
}
for(int i=1;i<=m;i++){
for(int j=1;j<=i;j++){
dp[i][j]=min(dp[i-1][j],nxt[dp[i-1][j-1]+1][s2[i]-'a']);
if(dp[i][j]<=r) lcs=max(lcs,j);
}
}
printf("%d\n",r - l + 1 + m - 2*lcs);
}
}
return 0;
}