动态规划(2)字符串编辑距离

题目描述:
给定一个源串和目标串,能够对源串进行如下操作:
1)在任意位置插入一个字符
2)替换任意字符
3)删除任意字符
写一个程序,实现返回最小操作次数,使得对源串进行上述这些操作后等于目标串(源串和目标串的长度都小于2000),这就是字符串编辑距离问题:
百度百科定义:
编辑距离(Edit Distance),又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。
例如将kitten一字转成sitting:
sitten (k→s)
sittin (e→i)
sitting (→g)
俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
思路:本题常见的求解思路是动态规划,假设令dp[i][j]表示源串S[0…i]和目标串T[0…j]的最短编辑距离,其边界dp[0][j] = j,dp[i][0] = i;状态转移方程:
dp[i][j] = min{dp[i-1][j]+1,S[i]不在T[0…j]中
dp[i-1][j-1]+1/0,S[i]在T[j]中,若S[i] == T[j]取0,S[i]落在T[j]后取1。
dp[i][j-1]+1,S[i]在T[0…j-1]中}
代码如下:

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#define min(x,y) ((x) > (y)?(y):(x))
//using namespace std;
int edit(char *S,char *T)
{
    int sLen = strlen(S);
    int tLen = strlen(T);
    int dp[sLen+1][tLen+1];
    int i = 0;
    int j = 0;
    for ( i = 1;i <= sLen;i++)
        dp[i][0] = i;
    for ( j = 1;j <= tLen;j++)
        dp[0][j] = j;
    for ( i = 1;i <= sLen;i++)
    {
        for (j = 1;j <= tLen;j++)
        {
            if (S[i-1] == T[j-1])
            {
                dp[i][j] = dp[i-1][j-1];
            }
            else
            {
                dp[i][j] = 1 + min(min(dp[i-1][j],dp[i][j-1]),dp[i-1][j-1]);//注意这里两个min
            }
        }
    }
    return dp[sLen][tLen];
}
int main()
{
    char S[] = "Kitten";
    char T[] = "sitting";
    printf("%d\n",edit(S,T));
    return 0;
}

运行结果:(centos5.5)
[root@localhost c++]# ./a.out
3
[root@localhost c++]#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

helloworddm

你的鼓励是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值