最小编辑距离 -- 解析及python实现

A[4]!=B[2],s[4][2]=min(s[4][1],s[3][1],s[3][2])+1=3

A[4]!=B[3],s[4][3]=min(s[4][2],s[3][2],s[3][3])+1=3

A[4]!=B[4],s[4][4]=min(s[4][3],s[3][3],s[3][4])+1=2

A|B

 

a

b

c

e

 

0

1

2

3

4

a

1

0

1

2

3

c

2

1

1

1

2

e

3

2

2

2

1

f

4

3

3

3

2

所以A—>B编辑距离为2次,操作为:acef在字符ac之间插入字符b,删除字符f

三、实验代码


1. 方法一:递归


A = input("输入字符串1:")

B = input("输入字符串2:")

def recursive_edit_distance(str_a, str_b):

    if len(str_a) == 0:

        return len(str_b)

    elif len(str_b) == 0:

        return len(str_a)

    elif str_a[len(str_a)-1] == str_b[len(str_b)-1]:

        return recursive_edit_distance(str_a[0:-1], str_b[0:-1])

    else:

        return min([

            recursive_edit_distance(str_a[:-1], str_b),

            recursive_edit_distance(str_a, str_b[:-1]),

            recursive_edit_distance(str_a[:-1], str_b[:-1])

        ]) + 1

print(recursive_edit_distance(A, B))

2. 方法二:动态规划


import nltk

A = input("输入字符串1:")

B = input("输入字符串2:")

def minDistance(w1, w2):

   m, n = len(w1),len(w2)

   if(m == 0):

      return m

   if(n == 0):

      return n

   step = [[0]*(n+1)for _ in range(m + 1)]

   for i in range(1, m+1):step[i][0]=i

   for j in range(1, n+1):step[0][j]=j

   for i in range(1, m+1):

      for j in range(1, n+1):

         if w1[i-1] == w2[j-1] :

            diff=0

         else:diff=1

         step[i][j] = min(step[i-1][j-1],min(step[i-1][j],step[i][j-1]))+diff

   return step[m][n]

print(minDistance(A,B))

打印出完整变换:

A = input("输入字符串1:")

B = input("输入字符串2:")

def edit_distance_Omn(str_a, str_b):

    if str_a == str_b:

        return 0

    if len(str_a) == 0:

        return len(str_b)

    if len(str_b) == 0:

        return len(str_a)

    dp = [[0 for _ in range(len(str_a) + 1)] for _ in range(len(str_b) + 1)]

    for i in range(len(str_b) + 1):

        dp[i][0] = i

    for j in range(len(str_a) + 1):

        dp[0][j] = j

    for i in range(1, len(str_b) + 1):

        for j in range(1, len(str_a) + 1):

            dp[i][j] = dp[i-1][j-1]

            if str_a[j-1] != str_b[i-1]:

                dp[i][j] = min([dp[i-1][j-1], dp[i-1][j], dp[i][j-1]]) + 1

  #打印完整路径矩阵(这一步非必要)

    '''for i in range(len(str_b) + 1):

        for j in range(len(str_a) + 1):

            print(dp[i][j])

        # print()'''

  # 准备倒着查询编辑路径,从右下角开始

    i , j = len(str_b), len(str_a)

    op_list = []  # 记录编辑操作

    while i > 0 and j > 0:

        if dp[i][j] == dp[i-1][j-1]:

            op_list.append("keep [ {} ]".format(str_b[i-1]))

            i, j = i-1, j-1

            continue

        if dp[i][j] == dp[i-1][j]  + 1:

            op_list.append("remove [ {} ]".format(str_b[i-1]))

            i, j = i-1, j

            continue

        if dp[i][j] == dp[i-1][j-1] + 1:

            op_list.append("change [ {} ] to [ {} ]".format(str_b[i-1], str_a[j-1]))

            i, j = i-1, j-1

            continue

        if dp[i][j] == dp[i][j-1] + 1:

            op_list.append("insert [ {} ]".format(str_a[j-1]))

            i, j = i, j-1

    for i in range(len(op_list)):

        print(op_list[len(op_list)-i-1])

    return dp[len(str_b)][len(str_a)]

print(edit_distance_Omn(A, B))



四、结果


参考链接:

https://www.cnblogs.com/AsuraDong/p/6957890.html

https://blog.csdn.net/qq_33085753/article/details/86595452

https://www.cnblogs.com/CheeseZH/p/8821282.html

本文转自 https://blog.csdn.net/Sabrina_cc/article/details/106040149,如有侵权,请联系删除。

文末

我一直觉得技术面试不是考试,考前背背题,发给你一张考卷,答完交卷等通知。

首先,技术面试是一个 认识自己 的过程,知道自己和外面世界的差距。

更重要的是,技术面试是一个双向了解的过程,要让对方发现你的闪光点,同时也要 试图去找到对方的闪光点,因为他以后可能就是你的同事或者领导,所以,面试官问你有什么问题的时候,不要说没有了,要去试图了解他的工作内容、了解这个团队的氛围。

前端面试题汇总

JavaScript

性能

linux

前端资料汇总

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值