Java版本最小编辑距离

一、需求背景

当前正在做一个文本纠错项目,需要对比两个字符串的差异并给出编辑方案:即通过何种变换(添加、删除、替换、插入等),很够将当前字符串变为目标字符串?

二、解决方案

基于上诉的需求,其中一种解决方案就是使用最小编辑距离思想实现:

/**
     * 最小编辑距离
     *
     * @param sourceStr 目标字符串
     * @param targetStr 欲修改的字符串
     * @return sourceStrResult, targetStrResult
     */
    public static String[] miniStrEdit(String sourceStr, String targetStr) {

        int len1 = sourceStr.length();
        int len2 = targetStr.length();

        int[][] dp = new int[len1 + 1][len2 + 1];

        // 预处理第一行和第一列
        for (int i = 0; i <= len1; i++) {
            dp[i][0] = i;
        }
        for (int j = 0; j <= len2; j++) {
            dp[0][j] = j;
        }

        // 动态规划填表
        for (int i = 1; i <= len1; i++) {
            for (int j = 1; j <= len2; j++) {
                // 如果当前两个字符相等,则不需要任何操作
                if (sourceStr.charAt(i - 1) == targetStr.charAt(j - 1)) {
                    dp[i][j] = dp[i - 1][j - 1];
                }
                else {
                    // 否则从三种方式中选择最小的
                    int min = Math.min(dp[i - 1][j - 1], Math.min(dp[i][j - 1], dp[i - 1][j]));
                    dp[i][j] = min + 1;
                }
            }
        }

        StringBuilder sourceBuilder = new StringBuilder(sourceStr);
        StringBuilder targetBuilder = new StringBuilder(targetStr);

        // 执行插入、替换、删除操作
        int i = len1;
        int j = len2;
        while (i > 0 && j > 0) {
            if (dp[i][j] == dp[i - 1][j - 1] && sourceStr.charAt(i - 1) == targetStr.charAt(j - 1)) {
                i--;
                j--;
            }
            else if (dp[i][j] == dp[i - 1][j - 1] + 1) {
                sourceBuilder.replace(i - 1, i, "<span class='replace'>" + sourceStr.charAt(i - 1) + "</span>");
                targetBuilder.replace(j - 1, j, "<span class='replace'>" + targetStr.charAt(j - 1) + "</span>");
                i--;
                j--;
            }
            else if (dp[i][j] == dp[i - 1][j] + 1) {
                sourceBuilder.insert(i - 1, "<span class='delete'>");
                sourceBuilder.insert(i - 1 + 22, "</span>");
                i--;
            }
            else if (dp[i][j] == dp[i][j - 1] + 1) {
                targetBuilder.insert(j - 1, "<span class='insert'>");
                int x = Math.min((j - 1 + 22), targetBuilder.toString().length());
                targetBuilder.insert(x, "</span>");
                j--;
            }
        }
        // 处理剩余部分
        while (i > 0) {
            sourceBuilder.insert(i, "<span class='delete'>");
            sourceBuilder.insert(i - 1 + 22, "</span>");
            i--;
        }

        while (j > 0) {
            targetBuilder.insert(j, "<span class='insert'>");
            targetBuilder.insert(j - 1 + 22, "</span>");
            j--;
        }

        return new String[]{sourceBuilder.toString(), targetBuilder.toString()};
    }

调用以后处理结果如下:

public class tt {
    public static void main(String[] args) {
        String s1 = "撤销平果县,以原平果县的兴政区域为平果市的兴政区域平果市人民政府驻码头镇铝城大道1780-6号。";
        String s2 = "撤销平果市,以原平果县人民政府的行政区域为平果市人民政府的行政区域平果人民政府驻码头镇铝城大道1780-6号。";

        String[] strings = StringUtils.miniStrEdit2(s1, s2);
        System.out.println(strings[0]);
        System.out.println(strings[1]);
       }
}
//撤销平果<span class='replace'>县</span>,以原平果县的<span class='replace'>兴</span>政区域为平果市的<span class='replace'>兴</span>政区域平果<span class='delete'>市</span>。
//撤销平果<span class='replace'>市</span>,以原平果县<span class='insert'>人</span><span class='insert'>民</span><span class='insert'>政</span><span class='insert'>府</span>的<span class='replace'>行</span>政区域为平果市<span class='insert'>人</span><span class='insert'>民</span><span class='insert'>政</span><span class='insert'>府</span>的<span class='replace'>行</span>政区域平果。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值