题目:
Given two words word1 and word2, find the minimum number of steps required to convert word1 to word2. (each operation is counted as 1 step.)
You have the following 3 operations permitted on a word:
a) Insert a character
b) Delete a character
c) Replace a character
编辑距离问题是经典的动态规划问题,指两个字符串之间由一个转成另一个所需的最少编辑次数。允许的编辑操作包括:
1. 将一个字符替换成另一个字符
2. 插入一个字符
3. 删除一个字符
其中插入字符就是删除字符的逆操作,例如kitten转化成sitting需要三个步骤:
1. ketten -> sitten (k->s)
2. sitten -> sittin (e->i)
3. sittin -> sitting (add g)
可以构造一个二维数组dp[ ][ ]来表示记录所需要的操作,数组行数表示字符串S的长度,数组列数表示字符串T的长度,dp[i][j]表示字符串S到第i位的子串和字符串T到第j的子串的编辑距离,如下图:
dp[i][j] 的值由 dp[i-1][j-1],dp[i-1][j],dp[i][j-1]中最小的值决定,如果是 dp[i-1][j-1]表示当前字符串S的第i位和字符串T的第j位进行匹配(替换操作),如果是 dp[i][j-1]表示当前字符串S的第i位和字符串T的第j-1位进行匹配,字符串T的第j位字符被删除(删除操作),如果是 dp[i-1][j]表示当前字符串S的第i-1位和字符串T的第j位进行匹配,字符串S的第i位字符被删除(删除操作)。
java实现代码:
public int minDistance(String word1, String word2) {
int s1 = word1.length();
int s2 = word2.length();
int [][]dp = new int[s1+1][s2+1];
dp[0][0] = 0;
for(int i=1;i<=s1;i++){
dp[i][0] = i;
}
for(int j=1;j<=s2;j++){
dp[0][j] = j;
}
for(int i=1;i<=s1;i++){
for(int j=1;j<=s2;j++){
int temp = word1.charAt(i-1) == word2.charAt(j-1)? 0: 1;
dp[i][j] = Math.min(dp[i-1][j-1]+temp,Math.min(dp[i-1][j]+1,dp[i][j-1]+1));
}
}
return dp[s1][s2];
}