编辑距离参考Python如何计算编辑距离
编辑方法包括:
- 插入一个字符
- 删除一个字符
- 替换一个字符
下面整理一下思路: - 简单情况:
(1) 两个空字符串: 距离为0if i ==0 and j ==0 : dp[i,[j] = 0
(2) 一个空字符串:距离为非空字符串的长度:if i==0 or j ==0: dp[i][j]=i+j
- 两个非空字符串:len(str1) = i, len(str2)=j, 则取以下情况较小值:
(1) 已知 i-1 长度的str1(str[:i]) 和 j-1 长度的str2(str2[:j-1])的编辑距离:若第i个字符和第j个字符相同,距离不变,不同,则距离+1
(2)已知i-1长度的str1 和 j 长度的str2的编辑距离,直接 +1,(即对str1 直接删除str1 的第 i 个元素)
(3) 已知 i 长度的str1 和 j -1 长度的str2的编辑距离, 直接+1 (即对str1 直接在末尾插入 str2的 j 元素)
记录表为二维数组dp[len(str1)+1][len(str2)+1]
dp[i][j]表示str[:i][:j]的编辑距离
示例:
# 简洁版
str1 = input()
str2 = input()
# dp直接赋初始值
dp = [[i+j for j in range(len(str2)+1)] for i in range(len(str1)+1)]
# 更新dp
for i