编辑距离即计算两个字符串相等需要的最小操作:增删改
力扣392. 判断子序列
力扣115. 不同的子序列
力扣583. 两个字符串的删除操作
力扣72. 编辑距离
前面三道题作为最后一题的铺垫,一步步增加难度,核心思想都是先判断两个字符是否相等,然后做不同的操作。此处直接以编辑距离的解法为根本,其余几道题只是少了其中的某些操作。
力扣72. 编辑距离 :
给你两个单词 word1 和 word2, 请返回将 word1 转换成 word2 所使用的最少操作数。你可以对一个单词进行如下三种操作:
插入一个字符
删除一个字符
替换一个字符
1. dp 数组定义:
dp[i][j] 表示为 word1 以 j-1 为结尾的子序列转换为 word2 以 i-1 为结尾的子序列所需的最少操作数。
2. 状态转移方程
对于每一个字符,有两种状态:相等或不相等
if word2[i-1] == word1[j-1]: 此时只有一种情况,即不操作
dp[i][j] = dp[i-1][j-1];
if word2[i-1] != word1[j-1]: 此时有三种操作方法
dp[i][j] = dp[i-1][j] + 1; 在 word1[j-1] 后插入一个字符等于 word2[i-1]
dp[i][j] = dp[i-1][j-1] + 1; 将 word1[j-1] 替换为 word2[i-1]
dp[i][j] = dp[i][j-1] + 1; 将 word1[j-1] 删除
对于这三种情况,取最小值: min({dp[i-1][j], dp[i-1][j-1], dp[i][j-1]}) + 1
3. 确定初始化值
由于dp[i][j]的值取决于[i-1]、[j-1] 的值,因此需要初始化 dp[0][j], dp[i][0]
dp[0][j] 表示 word2 为空字符串,则 word1 只能删除所有字符,即 dp[0][j] = j;
dp[i][0] 表示 word1 为空字符串,则 word1 需要增加 word2 的每一个字符,即 dp[i][0] = i;
4. 遍历顺序
显然从前往后遍历,依次得出 dp[i][j] 的值。
LC392. 判断子序列:s 是否为 t 的子序列 (即判断是否可以删除t的某些字符来使 t == s)
dp[i][j]: s 以 i-1 结尾的子序列 和 t 以 j-1 结尾的子序列的相同子序列的长度为dp[i][j].
1. s[i-1] == t[j-1]: dp[i][j] = dp[i-1][j-1] + 1; 不用操作
2. s[i-1] != t[j-1]: dp[i][j] = dp[i][j-1]; 需要删除 t[j-1], 再判断最长公共序列
LC115. 不同的子序列:计算在 s 的子序列中 t 出现的个数 (即可以删除 s 的某些字符)
dp[i][j]: s 以 i-1 结尾的子序列 包含 t 以 j-1 结尾的子序列的个数为dp[i][j].
1. s[i-1] == t[j-1]: dp[i][j] = dp[i-1][j-1] + dp[i-1][j];
dp[i-1][j-1]为不操作; dp[i-1][j]为可以删除 s[i-1], 然后判断s[0:i-2]包含t[0:j-1]的个数, 这种情况针对: s=bagg, t=bag.
2. s[i-1] != t[j-1]: dp[i][j] = dp[i-1][j-1]; 这种情况只能考虑 s[0:i-2]包含t[0:j-2]的个数
LC583. 两个字符串的删除操作:返回使得 word1 和 word2 相同所需的最小步数 (即可以删除任一字符串中的任一字符)
两个思路:第二个思路即将题目转换为 LC392.思路,判断最长公共子序列。
dp[i][j]: word1 以 i-1 结尾的子序列和 word2 以 j-1 结尾的子序列 相同所需的最小步数为dp[i][j].
dp[i][j]: word1 以 i-1 结尾的子序列和 word2 以 j-1 结尾的子序列 相同子序列的长度为dp[i][j].
------ 此处以第一个思路来计算 ------
1. word1[i-1] == word2[j-1]: dp[i][j] = dp[i-1][j-1]; 不操作
2. word1[i-1] != word2[j-1]: 此时有三种操作方法:
dp[i][j] = dp[i-1][j] + 1; 将 word1[i-1] 删除, 相当于 word2[j-1]后添加
dp[i][j] = dp[i-1][j-1] + 2; 将 word1[i-1] 和 word2[j-1] 删除
dp[i][j] = dp[i][j-1] + 1; 将 word2[j-1] 删除
取最小值: min({dp[i-1][j] + 1, dp[i-1][j-1] + 2, dp[i][j-1] + 1});
参考:
代码随想录