Java-动态规划学习(三)编辑距离

不多说了,放题

编辑距离,又称Levenshtein距离(也叫做Edit Distance),
是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。
许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,
删除一个字符。 
例如将kitten一字转成sitting: 
sitten (k->s) 
sittin (e->i) 
sitting (->g) 
所以kitten和sitting的编辑距离是3。俄罗斯科学家
Vladimir Levenshtein在1965年提出这个概念。 
给出两个字符串a,b,求a和b的编辑距离。

将问题进行转换 :
Fi,j表示第一个字符串的前i个字母和第二个字符串的前j个字母需要编辑的次数,求Fn,m,n和m分别是两个字符串的长度,那么此时需要考虑了的就是末尾的情况
对情况进行分析:
a. 当字符串末尾字符相等时,Fn,m= Fn-1,m-1;
b. 当字符串末尾字符不相等时:

如果通过修改使字符串相等的话,编辑距离为:
Fn,m = Fn-1,m-1+1,因为修改只需要一步。

如果通过删除n使字符串相等的话,编辑距离为: F~n,m~ = F~n-1,m~+1,因为不需要对第n个的编辑,对第n个进行了删除。

如果通过删除m使字符串相等的话,编辑距离为:F ~n,m~ = F~n,m-1~+1,原因与上面相同

如果通过增添一个字符使字符串相等的话,编辑距离为: F~n,m~=F~n-1,m~+1,此时对m进行增添,同理F~n,m~ = F~n,m-1~+1就是对n进行添加

最后,如果一个有值,另一个为空串的话,编辑距离为F~n,m~=max{n,m}

有了这些,就可以写状态方程 :

在这里插入图片描述
将i和j当做刚才的n,m就可以考虑出每一步的解,F[n][m]就是我们最后要的答案,还有一个刚刚说的特殊情况空串,所有在做二维数组时应该将外为先包裹上null串,从空开始考虑,用#表示空的话会有

#abc
#0123
a1012
c2111
b3312

可以看出从abc想要变成acb的最小编辑距离就是2
有了这些就可以写出程序了:

public int editDistance(String strN, String strM) {
        int[][] distanceMap = new int[strN.length() + 1][strM.length() + 1];
        //对边框进行初始化
        for (int i = 0; i < distanceMap.length; i++) {
            distanceMap[i][0] = i;
        }
        for (int i = 0; i < distanceMap[0].length; i++) {
            distanceMap[0][i] = i;
        }
        for (int i = 1; i < distanceMap.length; i++) {
            for (int j = 1; j < distanceMap[0].length; j++) {
                if (strN.charAt(i - 1) == strM.charAt(j - 1)) {
                    distanceMap[i][j] = distanceMap[i - 1][j - 1];
                } else {
                    int max = Math.min(distanceMap[i][j - 1], distanceMap[i - 1][j - 1]);
                    max = Math.min(distanceMap[i - 1][j], max);
                    distanceMap[i][j] = max + 1;
                }
            }
        }
        return distanceMap[strN.length()][strM.length()];
    }
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值