计算字符串的距离

本文介绍了Levenshtein距离,即编辑距离的概念,它表示两个字符串之间的最小编辑操作次数。解题思路是通过动态规划实现,给出状态转移方程和初始化条件,并阐述了如何计算任意两个字符串的编辑距离。
摘要由CSDN通过智能技术生成

【计算字符串的距离】

Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。
Ex:
字符串A: abcdefg
字符串B: abcdef
通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。
要求: 给定任意两个字符串,写出一个算法计算它们的编辑距离。
请实现如下接口

/* 功能:计算两个字符串的距离
* 输入: 字符串A和字符串B 
* 输出:无 
* 返回:如果成功计算出字符串的距离,否则返回-1 
*/
public static int calStringDistance(String charA, String charB) {
   
	return 0;
}

输入描述: 输入两个字符串
输出描述: 得到计算结果

【解题思路】:
本题需要用动态规划解题 状态: 子状态:word1的前1,2,3,…m个字符转换成word2的前1,2,3,…n个字符需要的编辑距离
F(i,j):word1的前i个字符于word2的前j个字符的编辑距离
状态递推: F(i,j) = min { F(i-1,j)+1, F(i,j-1) +1, F(i-1,j-1) +(w1[i]==w2[j]?0:1) }
上式表示从删除,增加和替换操作中选择一个最小操作数
F(i-1,j): w1[1,…,i-1]于w2[1,…,j]的编辑距离,删除w1[i]的字符—>F(i,j)
F(i,j-1): w1[1,…,i]于w2[1,…,j-1]的编辑距离,增加一个字符—>F(i,j)
F(i-1,j-1): w1[1,…,i-1]于w2[1,…,j-1]的编辑距离,
如果w1[i]与w2[j]相同, 不做任何操作,编辑距离不变,
如果w1[i]与w2[j]不同,替换w1[i]的字符为w2[j]—>F(i,j)
初始化: 初始化一定要是确定的值,如果这里不加入空串,初始值无法确定 F(i,0) = i :word与空串的编辑距离,删除操作 F(0,i) = i :空串与word的编辑距离,增加操作 返回结果:F(m,n)

#include <string> 
#include <iostream> 
#include <vector> 
using namespace std; 
int minDistance(string word1, string word2)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值