问题描述:编辑距离是针对二个字符串的差异程度的量化量测,量测方式是看至少需要多少次处理才能将一个字符串变成另一个字符串。编辑距离可以用在自然语言处理中,例如拼写检查可以根据一个拼错的字和其他正确的字的编辑距离,判断哪一个(或哪几个)是比较可能的字。DNA也可以视为用A、C、G和T组成的字符串,因此编辑距离也用在生物信息学中,判断二个DNA的类似程度。
要求:给定两个序列,假设可以有插入、替换和删除(单个字符)三种编辑操作,设计算法求出这两个序列的最小编辑距离。
完成最短编辑距离的求解需要用到动态规划方程:
可完成关键部分代码如下:
int l1=strlen(s1+1),l2=strlen(s2+1);
for(int i = 0;i <= l1;i++) dp[i][0]=i;
for(int i = 0;i <= l2;i++) dp[0][i]=i;
for(int i = 1;i <= l1;i++){
for(int j = 1;j <= l2;j++){
if (s1[i]==s2[j]) dp[i][j]=dp[i-1][j-1];
else dp[i][j]=min(dp[i-1][j-1],min(dp[i-1][j],dp[i][j-1]))+1;
}
}
最后返回:
cout<<dp[l1][l2];