返回 119. 编辑距离

描述
给出两个单词word1和word2,计算出将word1 转换为word2的最少操作次数。

你总共三种操作方法:

插入一个字符
删除一个字符
替换一个字符
您在真实的面试中是否遇到过这个题?  是
样例
给出 work1="mart" 和 work2="karma"

返回 3

分析:状态值D[i][j]表示,将word1的前i个字符转化为word2的前j个字符需要的最少步骤数

 

本题是典型的适合使用动态规划的题目。在斯坦福的公开课(中文英文)上,有对这个问题的详细说明,所以接下来就继续使用斯坦福公开课的例子了。

如果要计算单词"INTENTION"和单词"EXECUTION"之间的编辑距离,那么该怎么计算呢?

首先,把这个问题简单化。把上面两个单词简化为长度为1的两个单词I和E。

如果要“I”变化为"E",可以把"I"替换为"E"
如果要“I”变化为空串" ",可以把"I"删除,从而形成""
如果要空串“ ”变化为"E",可以把"E"插入,从而形成E

上面三种变化分别表示替换,删除,插入这三种基本操作。

接下来,定义一个表达式D(i,j)。它表示从第1个字单词的第0位至第i位形成的子串和第2个单词的第0位至第j位形成的子串的编辑距离。

显然,可以计算出动态规划的初始表达式,如下:

D(i,0) = i

D(0,j) = j

然后,考虑动态规划的状态转移方程式,如下:

                                   D(i-1, j) + 1
D(i,j)=min                  ( D(i, j-1) + 1 )
                                   D(i-1, j-1) +2( if  X(i) != Y(j) ) ; D(i-1,j-1) ( if  X(i) == Y(j) )

上面的状态转移方程的含义是,D(i,j)的值,要么是D(i-1, j)的操作完成之后删除一个字符(第1个单词的第i个字符),要么是D(i, j-1)的操作完成之后增加一个字符(第2个单词的第j个字符),要么是D(i-1, j-1)的操作完成自后替换一个字符(如果第1个单词的第i个字符和第2个单词的第j个字符不等),或者是D(i-1, j-1)的操作完成自后什么也不做(如果第1个单词的第i个字符和第2个单词的第j个字符相等)。其中,课件定义删除,插入,替换的操作步数分别为一步,一步,两步。lintcode测试时写的是一步

以第一个单词"INTENTION"和第二个单词"EXECUTION"为例,看下面的图




接下来,代码实现。注意在leetcode中,把插入,删除,替换全部视为一步操作。

代码:

class Solution {
public:
    /**
     * @param word1: A string
     * @param word2: A string
     * @return: The minimum number of steps.
     */
    int minDistance(string &word1, string &word2) {
        // write your code here
        int len1=word1.size();
        int len2=word2.size();
        vector<vector<int>> dis_matrix(len1+1,vector<int>(len2+1,0));
        
        for(int j=0;j<=len2;j++)
           dis_matrix[0][j]=j;
        for(int i=0;i<=len1;i++)
            dis_matrix[i][0]=i;
        
        for(int i=1;i<=len1;i++){
            for(int j=1;j<=len2;j++){
                int tmp_step;
                if( word1[i-1]==word2[j-1])//注意这里下标容易写错。一开始写成了if(word[i]==word2[j])
                    tmp_step=0+dis_matrix[i-1][j-1];
                else
                    tmp_step=1+dis_matrix[i-1][j-1];
                int tmp_step2=min((dis_matrix[i-1][j]+1),(dis_matrix[i][j-1]+1));
                dis_matrix[i][j]=min(tmp_step2,tmp_step);
            }
        }
        return dis_matrix[len1][len2];

    }
};

阅读更多
换一批

没有更多推荐了,返回首页