目录
583. 两个字符串的删除操作
题目链接:力扣
思路
做动态规划就是要一直想着dp数组是什么含义
1、确定dp数组的含义
dp[i][j]:以i-1为结尾的字符串word1,和以j-1位结尾的字符串word2,想要达到相等,所需要删除元素的最少次数
2、确定递推公式
有两种情况:
- 当word1[i - 1] 与 word2[j - 1]相同的时候
- dp[i][j] = dp[i - 1][j - 1];
- 当word1[i - 1] 与 word2[j - 1]不相同的时候
- 这里面有三种情况:
- 删word1[i - 1],最少操作次数为dp[i - 1][j] + 1
- 删word2[j - 1],最少操作次数为dp[i][j - 1] + 1
- 同时删word1[i - 1]和word2[j - 1],操作的最少次数为dp[i - 1][j - 1] + 2
- 这里面有三种情况:
3、初始化dp数组
从递推公式中,可以看出来,dp[i][0] 和 dp[0][j]是一定要初始化的
dp[i][0]:word2为空字符串,以i-1为结尾的字符串word1要删除多少个元素,才能和word2相同呢,所以dp[i][0] = i
dp[0][j]:word1为空字符串,以i-1为结尾的字符串word2要删除多少个元素,才能和word1相同呢,所以dp[0][j] = j
4、遍历顺序
从前向后,从上到下
两个字符串的删除操作
class Solution {
public int minDistance(String word1, String word2) {
int word1len = word1.length();
int word2len = word2.length();
// 创建dp数组
int[][] dp = new int[word1len + 1][word2len + 1];
// 初始化dp数组
for (int i = 0; i < word1len + 1; i++) {
dp[i][0] = i;
}
for (int j = 0; j < word2len + 1; j++) {
dp[0][j] = j;
}
// 推导dp数组
for (int i = 1; i < word1len + 1; i++) {
for (int j = 1; j < word2len + 1; j++) {
if (word1.charAt(i-1) == word2.charAt(j-1)) {
dp[i][j] = dp[i-1][j-1];
} else {
dp[i][j] = Math.min(dp[i-1][j]+1,dp[i][j-1]+1);
}
}
}
return dp[word1len][word2len];
}
}
72. 编辑距离
题目链接:力扣
思路
1、确定dp数组的含义
dp[i][j] 表示以下标i-1为结尾的字符串word1,和以下标j-1为结尾的字符串word2,最近编辑距离为dp[i][j]
2、确定递推公式
if (word1[i - 1] == word2[j - 1])
不操作
if (word1[i - 1] != word2[j - 1])
增
删
换
if (word1[i - 1] == word2[j - 1]) {
dp[i][j] = dp[i - 1][j - 1];
}
else {
dp[i][j] = min({dp[i - 1][j - 1], dp[i - 1][j], dp[i][j - 1]}) + 1;
}
3、初始化dp数组
dp[i][0] :以下标i-1为结尾的字符串word1,和空字符串word2,最近编辑距离为dp[i][0]。那么dp[i][0]就应该是i
dp[0][j]:以下标j-1为结尾的字符串word2,和空字符串word1,最近编辑距离为dp[0][j]。那么dp[0][j]就应该是j
4、遍历顺序
从前向后,从上到下
编辑距离
class Solution {
public int minDistance(String word1, String word2) {
int m = word1.length();
int n = word2.length();
// 创建dp数组
int[][] dp = new int[m+1][n+1];
// 初始化dp数组
for (int i = 1; i <= m; i++) {
dp[i][0] = i;
}
for (int i = 1; i <= n; i++) {
dp[0][i] = i;
}
// 推导dp数组
for (int i = 1; i <= m; i++) {
for (int j = 1; j <= n; j++) {
int left = dp[i][j-1] + 1;
int mid = dp[i-1][j-1];
int right = dp[i-1][j] + 1;
if (word1.charAt(i-1) != word2.charAt(j-1)) {
mid++;
}
dp[i][j] = Math.min(left,Math.min(mid,right));
}
}
return dp[m][n];
}
}
编辑距离总结篇
什么是编辑距离
- 编辑距离,又称Levenshtein距离(莱文斯坦距离也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数,如果它们的距离越大,说明它们越是不同。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符
- 可以用来做DNA分析,拼字检测,抄袭识别等等。总是比较相似的,或多或少我们可以考虑编辑距离
- 重点:编辑操作只有三种。插入,删除,替换这三种操作
如何找到最小的编辑距离
- 可以看作是一种操作路径的搜索,从一个字符串转变为另一个字符串的最短搜索路径。
- 从一个字符串转到另一个字符串的可能路径是非常多的,所有不同的操作路径,最终都会到达一种状态
- 采用动态规划的方法,每一种状态都记录下来最短的路径,然后得到最终的结果
- 编辑距离是用动规来解决的经典题目,题目看上去好像很复杂,但用动规可以很巧妙的算出最少编辑距离。