算法题——字符串距离

字符串距离
Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。
许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。

大致思路

  1. dp[x][y]数组表示strA中前x个字符转换为strB中前y个字符的代价,(代价矩阵为(N+1)*(M+1),M N 表示strA strB的长度)
  2. dp[x][y]的值是dp[x-1][y]+dc, dp[x][y-1]+ic, dp[x-1][y-1] +rc(或者dp[x-1][y-1])中的最小值
  3. 最后的返回结果为dp[m][n],表示从strA的m个字符串转换为strB的n个字符串的代价
 /* 字符串之间的距离,编辑距离,将strA编辑成strB所需的最小代价
* * 编辑操作包括插入一个字符、删除一个字符、替换一个字符
** 分别对应的代价是ic、dc、rc,insert cost、delete cost、replace cost
** strA[x-1]代表strA的第x个字符,注意下标是从0开始的,strA[y-1]代表strA的第y个字符
* * 定义一个代价矩阵为(N+1)*(M+1),M N 表示strA strB的长度
* * dp[x][y]表示strA的前x个字符串编辑成 strB的前y个字符所花费的代价

* * dp[x][y]是下面几种值的最小值:
* * 1、dp[x][y] = dp[x-1][y] + dc
* * dp[x-1][y]将strA的前x-1个字符编辑成strB的前y个字符的代价已知,
* * 那么将将strA的前x个字符编辑成strB的前y个字符的代价dp[x][y]就是dp[x-1][y] + dc
* * 相当于strA的前x-1个字符编辑成strB的前y个字符,现在变成了strA的前x个字符,增加了一个字符,要加上删除代价
* * 2、dp[x][y] = dp[x][y-1] + ic
* * dp[x][y-1]将strA的前x个字符编辑成strB的前y-1个字符的代价已知,
* * 现在变为strB的前y个字符,相应的在strA前x个操作代价的基础上插入一个字符
* * 3、dp[x][y] = dp[x-1][y-1]
* * dp[x-1][y-1]将strA的前x-1个字符编辑成strB的前y-1个字符的代价已知,
* * strA的第x个字符和strB的第y个字符相同,即strA[x-1] == strB[y-1],没有引入操作
* * 4、dp[x][y] = dp[x-1][y-1] + rc
* * strA的第x个字符和strB的第y个字符不相同,strA[x-1] != strB[y-1],
* * 在strA的前x-1个字符编辑成strB的前y-1个字符的代价已知的情况下,
* * 计算在strA的前x字符编辑成strB的前y个字符的代价需要加上替换一个字符的代价
* */

import java.util.Scanner;

public class calStringDistance {
    public static void main(String[] args) {
        Scanner input = new Scanner(System.in);
        while (input.hasNext()) {
            String strA = input.next();
            String strB = input.next();
            int ic = 1;
            int dc = 1;
            int rc = 1;
            int cost = strEditCost(strA, strB, ic, dc, rc);
            System.out.println(cost);
        }
        //关闭输入流
        input.close();
    }

    public static int strEditCost(String strA, String strB, int ic, int dc, int rc) {
       
        int m = strA.length();
        int n = strB.length();
        int[][] dp = new int[m + 1][n + 1];
        for (int i = 1; i <= n; i++) {
            //0个字符转化为i个字符的,是增加
            dp[0][i] = i * ic;
        }
        for (int i = 1; i <= m; i++) {
            dp[i][0] = i * dc;
        }
        for (int x = 1; x <= m; x++) {
            for (int y = 1; y <= n; y++) {
                int cost1 = dp[x - 1][y] + dc;
                int cost2 = dp[x][y - 1] + ic;
                int cost3 = 0;
                //xy意思是在数组里是前几个字符串,对应到str中第x个字符串就是charAt(x-1)
                if (strA.charAt(x - 1) == strB.charAt(y - 1)) {
                    cost3 = dp[x - 1][y - 1];
                } else {
                    cost3 = dp[x - 1][y - 1] + rc;
                }
                dp[x][y] = Math.min(cost1, cost2);
                dp[x][y] = Math.min(dp[x][y], cost3);
            }
        }
        return dp[m][n];
    }
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值