【编程马拉松】【027-最短编辑距离】

【编程马拉松算法目录】


【027-最短编辑距离】【工程下载>>>】


1 题目描述


  

1.1 输入描述:


  UNIX系统下有一个行编辑器ed,它每次只对一行文本做删除一个字符、插入一个字符或替换一个字符三种操作。例如某一行的内容是“ABC”,经过把第二个字符替换成“D”、删除第一个字符、末尾插入一个字符“B”,这三步操作后,内容就变成了“DCB”。即“ABC”变成“DCB”需要经过3步操作,我们称它们的编辑距离为3。
  现在给你两个任意字符串(不包含空格),请帮忙计算它们的最短编辑距离。

1.2 输出描述:


  输入包含多组数据。每组数据包含两个字符串m和n,它们仅包含字母,并且长度不超过1024。

1.3 输入例子:


ABC CBCD
ABC DCB

1.4 输出例子:


2
3

2 解题思路


  设A和B是2个字符串。要用最少的字符操作将字符串A转换为字符串B。这里所说的字符操作包括:
  (1) 删除一个字符;
  (2) 插入一个字符;
  (3) 将一个字符改为另一个字符。
  将字符串A变换为字符串B所用的最少字符操作数称为字符串A到B的编辑距离。设A的长度为m,B的长度为n创建一个二维数组d,大小为(m+1)*(n+1),来记录a1-am与b1-bn之间的编辑距离,要递推时,需要考虑对其中一个字符串的删除操作、插入操作和替换操作分别花费的开销,从中找出一个最小的开销即为所求结果。
  操作步骤:
  (一) 情况一:当A的长度为0,B的长度为j时,最小编辑距离就是j。
  (二) 情况二:当A的长度为i,B的长度为0时,最小编辑距离就是i。
  (三) 情况三:当A的长度为i,B的长度为j时,d[i][j]=min{d[i-1][j]+1,d[i][j-1]+1, d[i-1][j-1]+(A[i]==B[j]?0:1)}
  其中:
   ● d[i][j]表示A的前i个字符和B的前j个字符相同后的最短距离。
   ● d[i][j]来自于三种状态
    ■ 删除,d[i-1][j]+1,A1,…,Ai-1经过操作可以变成了B1,…,Bj,那么A1,…,Ai-1Ai变为B1,…,Bj一定要删除Ai。
    ■ 插入,d[i][j-1]+1,A1,…,Ai经过操作可以变成了B1,…,Bj-1Bj,那么A1,…,Ai-1Ai变为B1,…,Bj-1Bj一定要添加一个字符。
    ■ 替换,如果A[i]=B[j],可以不进行额外的操作,那么有d[i][j]=d[i-1][j-1],如果不A[i]≠B[j],那么就要进行一次替换操作,有d[i][j]=d[i-1][j-1]+1。
  注意:此处字符串中字符开始的下标从1开始计算
  根据分析可以得到递推方程:

d[i][j]=jimin{d[i1][j]+1,d[i][j1]+1,d[i1][j1]+f(i,j)}i=0j=0i>0andj>0

f(i,j)={10i>0andj>0andA[i]B[j]i>0andj>0andA[i]=B[j]

3 算法实现


import java.util.Scanner;

/**
 * Author: 王俊超
 * Time: 2016-05-13 20:12
 * CSDN: http://blog.csdn.net/derrantcm
 * Github: https://github.com/Wang-Jun-Chao
 * Declaration: All Rights Reserved !!!
 */
public class Main {
    public static void main(String[] args) {
        Scanner scanner = new Scanner(System.in);
//        Scanner scanner = new Scanner(Main.class.getClassLoader().getResourceAsStream("data.txt"));
        while (scanner.hasNext()) {
            String s = scanner.next();
            String t = scanner.next();

            System.out.println(shortest(s, t));

        }

        scanner.close();
    }

    /**
     * 最短编辑距离
     *
     * @param s 字符串
     * @param t 字符串
     * @return 最短编辑距离
     */
    private static int shortest(String s, String t) {

        int row = s.length() + 1;
        int col = t.length() + 1;

        // 初始化
        int[][] d = new int[row][col];
        for (int i = 0; i < row; i++) {
            d[i] = new int[col];
        }

        // 设置第一列
        for (int i = 0; i < row; i++) {
            d[i][0] = i;
        }

        // 设置第一行
        for (int j = 0; j < col; j++) {
            d[0][j] = j;
        }

        for (int i = 1; i < row; i++) {
            for (int j = 1; j < col; j++) {
                int u = d[i - 1][j] + 1;
                int v = d[i][j - 1] + 1;
                int w = d[i - 1][j - 1];
                if (s.charAt(i - 1) != t.charAt(j - 1)) {
                    w++;
                }

                d[i][j] = Math.min(u, Math.min(v, w));
            }
        }

        return d[row - 1][col - 1];
    }
}

4 测试结果


这里写图片描述

5 其它信息


因为markddow不好编辑,因此将文档的图片上传以供阅读。Pdf和Word文档可以在Github上进行【下载>>>】

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
马拉松编程题目是一种挑战性的编程竞赛,要求参赛者在有限的时间内解决一系列复杂的编程问题。这些题目旨在测试参赛者的编程技能、算法思维和解决问题的能力。 在NOI(全国青少年信息学奥林匹克竞赛)中,编程马拉松题目非常有名。参赛者通常需要在一天内完成多个编程问题,每个问题的难度和复杂性都不同。这些题目可能涉及算法、数据结构、动态规划、图论等各种领域。 参赛者在比赛开始时会收到一份题目清单,然后他们需要逐个解决各个问题。解题速度和准确性是评判参赛者成绩的重要指标。因为时间有限,参赛者需要在压力下迅速找到问题的解决方法,并编写高效的代码。 编程马拉松不仅考察了参赛者的编程技能,也考验了他们的团队合作能力。许多编程马拉松都是以小组形式进行,每个小组的成员需要相互配合,合理分工,共同完成任务。 参加编程马拉松有助于提升参赛者的编程能力和解决问题的能力。通过面临各种难题和时间限制,参赛者能够锻炼自己的思维能力和解决问题的方法。此外,参加编程马拉松还能与其他优秀的编程爱好者交流、学习,扩展自己的知识和视野。 总之,编程马拉松是一种激动人心的编程竞赛,可以帮助参赛者提升编程能力和解决问题的能力。这种比赛不仅考察了编程技能,还培养了团队合作和应对压力的能力,对于对编程有兴趣的人来说是一次难得的学习和锻炼机会。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值