编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
收起
输入
第1行:字符串a(a的长度 <= 1000)。 第2行:字符串b(b的长度 <= 1000)。
输出
输出a和b的编辑距离
输入样例
kitten sitting
输出样例
3
一开始看到该题想到的是最长公共子序列,用较长串的长度减去最长的公共子序列长度不就是了么。然后发现这还和公共子串所在的位置有关系,这就是那些删除和添加操作。dp[i][j]表示的是a串的i位置和b串的j位置的编辑距离。一开始想那些添加和删除的转移的时候没有想到从那个状态转移过来然后一开始写的是
dp[i][j]=min(dp[i-1][j-1]+1,min(dp[i][j+1]+1,dp[i+1][j]+1));
这一句看这状态转移方程想着后面两个状态还没有更新就给他前移一位吧,然后就瞎猫碰到死耗子的和答案那个状态转移方程一样了。后来看了看算法的解释说明
首先每个位置都必须从插入删除和修改三个方面转移过来就算你当前I J两个位置相等说不定就有从其他位置转移过来的比他小呢。
dp[i-1][j-1]表示修改的转移,剩下两个是插入删除。
如果说在I位置插入的话那么I就要后移只需要知道I往后和J+1往后能编辑距离最小就行 那么就要从前面dp[i-1][j]转移过来。
如果说在I位置删除的话那么I+1就要前移那就需要I+1和J往后的能最小编辑距离那么就需要dp[i][j-1]转移过来。
然后整出来了还卡了一点 初始化!要把这两个串分别和0串匹配的时候初始化很显然就是该串目前长度。
#include <iostream>
#include <cstdio>
#include <set>
#include <map>
#include <algorithm>
#include <string.h>
#include <vector>
#include <queue>
#include <stack>
using namespace std;
string a,b;
int dp[2000][2000];
int main()
{
int n,m;
while(cin>>a>>b)
{
memset(dp,0x3f3f3f3f,sizeof(dp));
dp[0][0]=0;
for(int i=1;i<=a.size();i++)
dp[i][0]=i;
for(int i=1;i<=b.size();i++)
dp[0][i]=i;
for(int i=1;i<=a.size();i++)
{
for(int j=1;j<=b.size();j++){
if(a[i-1]==b[j-1]){
dp[i][j]=dp[i-1][j-1];
//dp[i][j]=min(dp[i-1][j-1],min(dp[i-1][j]+1,dp[i][j-1]+1));俩都行
}
else{
dp[i][j]=min(dp[i-1][j-1]+1,min(dp[i-1][j]+1,dp[i][j-1]+1));
}
}
}cout<<dp[a.size()][b.size()]<<endl;}
}