不同的子序列
题目描述
给你两个字符串 s
和 t
,统计并返回在 s
的 子序列 中 t
出现的个数,结果需要对 109 + 7 取模。
示例 1:
输入:s = "rabbbit", t = "rabbit"
输出:3
解释:
如下所示, 有 3 种可以从 s 中得到 "rabbit" 的方案。
rabbbit
rabbbit
rabbbit
示例 2:
输入:s = "babgbag", t = "bag"
输出:5
解释:
如下所示, 有 5 种可以从 s 中得到 "bag" 的方案。
babgbag
babgbag
babgbag
babgbag
babgbag
解题思路
-
确定dp数组以及下标的含义
dp[i][j]
表示在s
的前i
个字符中,t
的前j
个字符出现的次数。
-
确定递推公式
-
如果
s[i-1] == t[j-1]
,递推公式:dp[i][j] = dp[i-1][j-1] + dp[i-1][j]
dp[i-1][j-1]
表示:在s
的前i-1
个字符中,t
的前j-1
个字符出现的次数。因为s[i-1]
和t[j-1]
相等,所以可以把这对匹配的字符加上,形成新的匹配。dp[i-1][j]
表示:在s
的前i-1
个字符中,t
的前j
个字符出现的次数。这里表示跳过当前的s[i-1]
,但仍然保留前面已匹配的子序列次数。
-
如果
s[i-1] != t[j-1]
,递推公式:dp[i][j] = dp[i-1][j]
- 由于
s[i-1]
和t[j-1]
不相等,所以不能通过这两个字符形成新的匹配,因此只能跳过s[i-1]
,保留s
的前i-1
个字符中t
的前j
个字符的匹配次数。
- 由于
-
-
dp数组初始化
dp[i][0]
(表示在s
的前i
个字符中,空字符串出现的次数)都应该初始化为1
,dp[0][j]
(表示在空字符串中,t
的前j
个字符出现的次数)除了dp[0][0] = 1
外,其他都应该初始化为0
。
-
确定遍历顺序
- 对于
dp[i][j]
,其值与dp[i-1][j]
、dp[i-1][j-1]
有关,因此需要保证dp[i-1][j]
、dp[i-1][j-1]
在dp[i][j]
之前被计算。所以,遍历顺序应该是从左到右,逐行进行。
- 对于
-
举例推导dp数组
-
以s:“baegg”,t:"bag"为例,手动推导dp数组状态如下:
-
代码实现
测试地址:https://leetcode.cn/problems/distinct-subsequences/
class Solution {
public:
int numDistinct(string s, string t) {
// 创建一个二维DP数组,dp[i][j]表示在s的前i个字符中,t的前j个字符出现的次数
vector<vector<uint64_t>> dp(s.size() + 1, vector<uint64_t>(t.size() + 1));
// 初始化dp数组的第一列,表示在s的前i个字符中,空字符串出现的次数,显然都为1
for (int i = 0; i <= s.size(); i++) dp[i][0] = 1;
// 初始化dp数组的第一行,除了dp[0][0]为1,其他dp[0][j]表示在空字符串中,t的前j个字符出现的次数,显然都为0
for (int j = 1; j <= t.size(); j++) dp[0][j] = 0;
// 遍历字符串s和t
for (int i = 1; i <= s.size(); i++) {
for (int j = 1; j <= t.size(); j++) {
// 如果当前字符相等,那么dp[i][j]应该是dp[i - 1][j - 1](选择当前字符)和dp[i - 1][j](不选择当前字符)的和
if (s[i-1] == t[j-1]) {
dp[i][j] = dp[i - 1][j - 1] + dp[i - 1][j];
}
// 如果当前字符不相等,那么dp[i][j]应该等于dp[i - 1][j]
else {
dp[i][j] = dp[i - 1][j];
}
}
}
// 返回在s中,t出现的次数
return dp[s.size()][t.size()];
}
};
两个字符串的删除操作
题目描述
给定两个单词 word1
和 word2
,返回使得 word1
和 word2
相同所需的最小步数。
每步 可以删除任意一个字符串中的一个字符。
示例 1:
输入: word1 = "sea", word2 = "eat"
输出: 2
解释: 第一步将 "sea" 变为 "ea" ,第二步将 "eat "变为 "ea"
示例 2:
输入:word1 = "leetcode", word2 = "etco"
输出:4
解题思路
思路一
-
确定dp数组以及下标的含义
dp[i][j]
表示将word1
的前i
个字符转换为word2
的前j
个字符所需的最小操作数。
-
确定递推公式
-
如果
word1[i - 1] == word2[j - 1]
,递推公式为:dp[i][j] = dp[i - 1][j - 1]
,因为当前字符相同,不需要额外操作。 -
如果
word1[i - 1] != word2[j - 1]
,则需要考虑三种操作:- 删除
word1[i - 1]
:dp[i - 1][j] + 1
- 插入
word2[j - 1]
:dp[i][j - 1] + 1
- 替换
word1[i - 1]
为word2[j - 1]
或是两个字符串同时删除当前元素:dp[i - 1][j - 1] + 2
(因为替换和删除都需要两次操作:删除和插入) - 取这三种操作的最小值,最终的递推公式为:
dp[i][j] = min(dp[i - 1][j] + 1, min(dp[i][j - 1] + 1, dp[i - 1][j - 1]
- 删除
-
-
dp数组初始化
-
dp[i][0]
表示将word1
的前i
个字符转换为空字符串所需的操作数,即删除i
次,所以dp[i][0] = i
。 -
dp[0][j]
表示将word2
的前j
个字符转换为空字符串所需的操作数,即删除j
次,所以dp[0][j] = j
。
-
-
确定遍历顺序
- 从左到右,从上到下遍历
dp
数组,确保在计算dp[i][j]
时,dp[i - 1][j]
、dp[i][j - 1]
和dp[i - 1][j - 1]
已经计算完毕。
- 从左到右,从上到下遍历
-
举例推导dp数组
-
以word1:“sea”,word2:"eat"为例,手动推导dp数组状态图如下:
-
思路二
如果两个字符串能够分别通过删除一定的元素得到相同的子字符串,那么说明这个子字符串属于两个字符串的最长公共子序列,因此要想得到最少的操作数,可以通过这么一个等式:word1.size() + word2.size() - 2 * LCS长度
来得到。
代码实现
测试地址:https://leetcode.cn/problems/delete-operation-for-two-strings/
思路一代码如下:
class Solution {
public:
int minDistance(string word1, string word2) {
vector<vector<int>> dp(word1.size() + 1, vector<int>(word2.size() + 1, 0));
// 初始化第一行和第一列
for (int i = 0; i <= word1.size(); i++) {
// dp[i][0] 表示将 word1 的前 i 个字符转换为空字符串所需的操作数,即删除 i 次
dp[i][0] = i;
}
for (int j = 1; j <= word2.size(); j++) {
// dp[0][j] 表示将 word2 的前j个字符转换为空字符串所需的操作数,即删除j次
dp[0][j] = j;
}
// 从左到右,从上到下遍历
for (int i = 1; i <= word1.size(); i++) {
for (int j = 1; j <= word2.size(); j++) {
if (word1[i - 1] == word2[j - 1]) {
// 如果当前字符相同,则不需要额外操作
dp[i][j] = dp[i - 1][j - 1];
} else {
// 如果当前字符不同,考虑三种操作:删除、插入、替换
// 删除:dp[i - 1][j] + 1
// 插入:dp[i][j - 1] + 1
// 替换:dp[i - 1][j - 1] + 2(因为替换需要两次操作:删除和插入)
dp[i][j] = min(dp[i - 1][j] + 1, min(dp[i][j - 1] + 1, dp[i - 1][j - 1] + 2));
}
}
}
// 返回将 word1 转换为 word2 所需的最小操作数
return dp[word1.size()][word2.size()];
}
};
思路二代码如下:
class Solution {
public:
int minDistance(string word1, string word2) {
vector<vector<int>> dp(word1.size() + 1,
vector<int>(word2.size() + 1, 0));
// 构建 dp 数组
for (int i = 1; i <= word1.size(); i++) {
for (int j = 1; j <= word2.size(); j++) {
// 如果字符相同,则在前一个基础上加一
// 这里实际上寻找的是最长公共子序列的长度
if (word1[i - 1] == word2[j - 1]) {
dp[i][j] = dp[i - 1][j - 1] + 1;
} else {
// 如果字符不同,取上方和左方的较大值
// 同样是为了求最长公共子序列的长度
dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
}
}
}
// 根据最长公共子序列的长度计算最少操作次数
// 整体长度减去两倍的公共部分长度
return (word1.size() + word2.size()) -
2 * dp[word1.size()][word2.size()];
}
};
编辑距离
题目描述
给你两个单词 word1
和 word2
, 请返回将 word1
转换成 word2
所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
- 插入一个字符
- 删除一个字符
- 替换一个字符
示例 1:
输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')
示例 2:
输入:word1 = "intention", word2 = "execution"
输出:5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')
解题思路
-
确定dp数组以及下标的含义
dp[i][j]
:表示word1
的前i
个字符转换成word2
的前j
个字符所使用的最少操作数。
-
确定递推公式
-
当前字符相等时:
- 如果
word1
的第i
个字符和word2
的第j
个字符相同,那么它们互相匹配不需要任何操作,所以当前位置的操作数与word1
的前i-1
个字符和word2
的前j-1
个字符所需操作数相同。 - 因此,递推公式是:
dp[i][j] = dp[i - 1][j - 1]
- 如果
-
当前字符不相等时:
-
如果
word1
的第i
个字符和word2
的第j
个字符不同,则考虑三种操作:- 插入操作:我们可以在
word1
的第i
个字符后面插入一个与word2
的第j
个字符相同的字符,这样word2
的第j
字符就被匹配了。此时,我们需要看word1
的前i
个字符转换成word2
的前j-1
个字符需要的最少操作数,加上这一次的插入操作,即dp[i][j-1] + 1
。 - 删除操作:我们可以删除
word1
的第i
个字符,然后再看word1
的前i-1
个字符转换成word2
的前j
个字符需要的最少操作数,加上这一次的删除操作,即dp[i-1][j] + 1
。 - 替换操作:我们可以将
word1
的第i
个字符替换为word2
的第j
个字符,这样两个字符就被匹配了。此时,我们需要看word1
的前i-1
个字符转换成word2
的前j-1
个字符需要的最少操作数,加上这一次的替换操作,即dp[i-1][j-1] + 1
。
- 插入操作:我们可以在
-
在这三种情况中,我们选择操作次数最少的一种,故递推公式是:
dp[i][j] = min(dp[i-1][j] + 1, dp[i][j-1] + 1, dp[i-1][j-1] + 1)
-
-
-
dp数组初始化
dp[i][0]
,即word1
的前i
个字符转换成空字符串所需要的操作数,即删除操作,所以dp[i][0] = i
。dp[0][j]
,即空字符串转换成word2
的前j
个字符所需要的操作数,即插入操作,所以dp[0][j] = j
。
-
确定遍历顺序
- 由于
dp[i][j]
的计算依赖于dp[i - 1][j]
(上方)、dp[i][j - 1]
(左方)和dp[i - 1][j - 1]
(左上方),我们需要从左到右、从上到下的顺序填充dp
数组。 - 首先,初始化第一行和第一列,然后开始遍历填充剩下的
dp
数组。
- 由于
-
举例推导dp数组
-
以示例1为例,输入:
word1 = "horse", word2 = "ros"
为例,手动推导dp矩阵状态图如下:
-
代码实现
测试地址:https://leetcode.cn/problems/edit-distance/
class Solution {
public:
int minDistance(string word1, string word2) {
// 初始化二维 dp 数组
vector<vector<int>> dp(word1.size() + 1, vector<int>(word2.size() + 1, 0));
// dp[i][0] 表示 word1 的前 i 个字符转换成空字符串所需要的操作数,即删除操作
for (int i = 0; i <= word1.size(); i++) {
dp[i][0] = i;
}
// dp[0][j] 表示空字符串转换成 word2 的前 j 个字符所需要的操作数,即插入操作
for (int j = 1; j <= word2.size(); j++) {
dp[0][j] = j;
}
// 遍历 word1 和 word2,计算 dp 数组的值
for (int i = 1; i <= word1.size(); i++) {
for (int j = 1; j <= word2.size(); j++) {
// 当 word1 的第 i 个字符和 word2 的第 j 个字符相同,dp[i][j] 等于左上角的值
if (word1[i - 1] == word2[j - 1]) {
dp[i][j] = dp[i - 1][j - 1];
}
// 当 word1 的第 i 个字符和 word2 的第 j 个字符不相同,dp[i][j] 等于左边、上边和左上角的值中的最小值 + 1
else {
dp[i][j] = min(dp[i - 1][j] + 1, min(dp[i][j - 1] + 1, dp[i - 1][j - 1] + 1));
}
}
}
// 返回 word1 转换成 word2 所需要的最少操作数
return dp[word1.size()][word2.size()];
}
};