题目描述
我们称一个字符串 S 包含字符串 T 是指 T 是 S 的一个子序列,即可以从字符串 S 中抽出若干个字符,它们按原来的顺序组合成一个新的字符串与 T 完全一样。
给定两个字符串 S 和 T,请问最少修改 S 中的多少个字符,能使 S 包含 T ?
其中, 1 ≤ ∣ T ∣ ≤ ∣ S ∣ ≤ 10001 ≤ ∣ T ∣ ≤ ∣ S ∣ ≤ 1000 1 \leq |T| \leq |S| \leq 10001≤∣T∣≤∣S∣≤1000 1≤∣T∣≤∣S∣≤10001≤∣T∣≤∣S∣≤1000。
输入描述
输入两行,每行一个字符串。
第一行的字符串为 S,第二行的字符串为 T。
两个字符串均非空而且只包含大写英文字母。
输出描述
输出一个整数,表示答案。
输入输出样例
示例
输入
ABCDEABCD
XAABZ
输出
3
确定dp数组含义
dp[i][j]
用到str2[i - 1]结尾的字符串去匹配到str1[j - 1]结尾的字符串,此时str1[j - 1]结尾的字符串最少修改的字符数。
确定递推式
- 如果
str1[j - 1] == str2[i - 1]
,两字符串结尾相同,无须修改字符,情况数等同于拿到str2[i - 2]
的字符串去匹配到str1[j - 2]
的字符串。即:dp[i][j] = dp[i - 1][j - 1];
- 如果
str1[j - 1] != str2[i - 1]
,两字符串结尾不同- 不修改字符,则等同于拿到
str2[i - 1]
的字符串去匹配到str1[j - 2]
的字符串 - 修改字符,则修改数等于拿到
str2[i - 2]
的字符串去匹配到str1[j - 2]
的字符串的修改数加1,即我们进行了一次修改操作
综上,我们取修改数最少的情况:dp[i][j] = min(dp[i - 1][j - 1] + 1, dp[i][j - 1]);
- 不修改字符,则等同于拿到
初始化dp数组
我们把第0行初始为0,也就说空集是任何集合的子集,我们不需要修改str1就能使其包含空集。即:for (auto &n : dp[0]) n = 0;
注意,这里必须是“auto &n
”,否则我们实际上并没有修改dp中的元素。
把第0列除了dp[0][0]
以外的元素初始化为INT_MAX,以此表示非法。因为我们无法修改空集作为str1,使其匹配非空集合str2。(题目中说的是修改str1,我就当必须一个元素改成另一个元素,而不能像经典编辑距离问题那样增加或删除元素)
确定遍历顺序
根据递推公式,可知从左到右从上到下。
for (int i = 1; i < dp.size(); i++) {
for (int j = i; j < dp[i].size(); j++) {
// 递推式
}
}
内层for循环,j从i开始递增,一方面能减少计算量,提高效率;另一方面,之前我们的INT_MAX一旦加一,就会出现溢出,变成负数,导致整个动态规划失效。
代码实现
#include <bits/stdc++.h>
using namespace std;
int main(void) {
string str1, str2;
cin >> str1 >> str2;
vector<vector<int> > dp(str2.size() + 1, vector<int>(str1.size() + 1, INT_MAX));
// dp[i][j]用到str2[i - 1]的元素去匹配到str1[j - 1]的字符串,此时str1最少修改的字符数
for (auto &n : dp[0]) n = 0; // 把第0行数据全部置为0
for (int i = 1; i < dp.size(); i++) {
for (int j = i; j < dp[i].size(); j++) {
if (str1[j - 1] == str2[i - 1]) {
dp[i][j] = dp[i - 1][j - 1];
} else {
dp[i][j] = min(dp[i - 1][j - 1] + 1, dp[i][j - 1]);
}
}
}
cout << dp.back().back();
// system("pause");
return 0;
}