72. 编辑距离 ●●●
描述
给你两个单词 word1 和 word2, 请返回将 word1 转换成 word2 所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
- 插入一个字符
- 删除一个字符
- 替换一个字符
示例
输入:word1 = “horse”, word2 = “ros”
输出:3
解释:
horse -> rorse (将 ‘h’ 替换为 ‘r’)
rorse -> rose (删除 ‘r’)
rose -> ros (删除 ‘e’)
题解
1. 动态规划(子序列问题)
dp[i][j]
表示以 s[i-1], t[j-1]为末尾时所需操作步数;if(s[i-1] == t[j-1]) dp[i][j] = dp[i-1][j-1];
如果当前这对字符相等,等于上一组数的步数,即都不操作
if(s[i-1] != t[j-1]) dp[i][j] = min(dp[i-1][j-1], min(dp[i][j-1], dp[i-1][j])) + 1;
如果字符不相等,则根据步数来判断删除当前遍历行还是列上的字符(在字符串1删除元素,等效于在另一字符串增加元素),或者在上一组的基础上替换其中一个字符。- 边界条件初始化:
dp[0][j] = j;
dp[i][0] = i;
意味着空字符与其他字符串匹配的步数; - 双层循环,从上到下,从左到右。
时间复杂度:
O
(
n
×
m
)
O(n × m)
O(n×m)
空间复杂度:
O
(
n
×
m
)
O(n × m)
O(n×m)
class Solution {
public:
int minDistance(string word1, string word2) {
int len1 = word1.length();
int len2 = word2.length();
vector<vector<int>> dp(len1+1, vector<int>(len2+1, 0));
for(int i = 0; i <= len1; ++i) dp[i][0] = i; // 边界条件初始化
for(int j = 0; j <= len2; ++j) dp[0][j] = j;
for(int i = 1; i <= len1; ++i){
for(int j = 1; j <= len2; ++j){
if(word1[i-1] == word2[j-1]){
dp[i][j] = dp[i-1][j-1]; // 相等时,等于上一组数的步数
}else{
dp[i][j] = min(dp[i-1][j-1], min(dp[i][j-1], dp[i-1][j])) + 1; // 根据更小的步数来判断操作
}
}
}
return dp[len1][len2];
}
};
HJ52 计算字符串的编辑距离 ●●
描述
Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家 Levenshtein 提出的,故又叫 Levenshtein Distance 。
例如:
字符串A: abcdefg
字符串B: abcdef
通过增加或是删掉字符 ”g” 的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。
要求:
给定任意两个字符串,写出一个算法计算它们的编辑距离。
数据范围:给定的字符串长度满足 1 ≤ l e n ( s t r ) ≤ 1000 1 \le len(str) \le 1000 1≤len(str)≤1000
输入
每组用例一共2行,为输入的两个字符串
输出
每组用例输出一行,代表字符串的距离
示例
输入:
horse
ros
输出:
3
解释:
horse -> rorse (将 ‘h’ 替换为 ‘r’)
rorse -> rose (删除 ‘r’)
rose -> ros (删除 ‘e’)
题解
1. 动态规划(ACM C语言)
注意二维动态数组的创建
// 二维动态数组的创建
int** dp;
dp = (int**)malloc(sizeof(int*) * (len1 + 1)); // 整数指针的大小 * len+1
for(int i = 0; i <= len1; ++i) dp[i] = (int*)malloc(sizeof(int) * (len2 + 1)); // 整数大小 * len2+1
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int min(int a, int b){
if(a < b){
return a;
}else{
return b;
}
}
int main(){
char str1[1000];
char str2[1000];
scanf("%s", str1);
scanf("%s", str2);
const int len1 = strlen(str1), len2 = strlen(str2);
// 二维动态数组的创建
int** dp;
dp = (int**)malloc(sizeof(int*) * (len1 + 1)); // 整数指针的大小 * len+1
for(int i = 0; i <= len1; ++i) dp[i] = (int*)malloc(sizeof(int) * (len2 + 1)); // 整数大小 * len2+1
for(int i = 0; i <= len1; ++i) dp[i][0] = i; // 初始化第一列
for(int i = 0; i <= len2; ++i) dp[0][i] = i; // 初始化第一行
for(int i = 0; i < len1; ++i){
for(int j = 0; j < len2; ++j){
if(str1[i] == str2[j]){
dp[i+1][j+1] = dp[i][j];
}else{
dp[i+1][j+1] = min(min(dp[i][j], dp[i][j+1]), dp[i+1][j]) + 1;
}
}
}
printf("%d", dp[len1][len2]);
return 0;
}