Problem Description
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input
第1行:字符串a(a的长度 <= 1000)。
第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Input示例
kitten
sitting
Output示例
3b
思路:
核心 dp[i][j] = min(dp[i - 1][j - 1] + same(i - 1, j - 1), dp[i - 1][j] + 1, dp[i][j - 1] + 1); 其中same表示 a[i] == b[j] 为0,否则为1; 初始化也很重要,详情看代码
#include<bits/stdc++.h>
using namespace std;
int dp[1005][1005];//dp[i][j]表示,a字符串0到i,b字符串0到j,a字符串变到b字符串的编辑距离
char a[1005], b[1005];
int same(int i, int j)
{
if(a[i] == b[j]) return 0;
else return 1;
}
int main()
{
int len, len1, i, j;
while(~scanf("%s %s", a, b))
{
memset(dp, 0, sizeof(dp));
len = strlen(a);
len1 = strlen(b);
for(i = 0; i <= len; i++)//初始化,长度i的a字符串 变为长度0的b字符串,只需要全删所以编辑长度就是长度
{
dp[i][0] = i;
}
for(i = 0; i <= len1; i++)//同理
{
dp[0][i] = i;
}
for(i = 1; i <= len; i++)
{
for(j = 1; j <= len1; j++)//取三者最小值
{
dp[i][j] = min(min(dp[i - 1][j - 1] + same(i - 1, j - 1), dp[i - 1][j] + 1), dp[i][j - 1] + 1);
}
}
printf("%d\n", dp[len][len1]);
}
return 0;
}