Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
如bankcomm和bocomm的距离为3,只要将‘o'改为’a'再增加‘nk’,bocomm就和bankcomm相同。所以距离为3
利用动态规划求解:
建立一个二维数组dp[m][n],m和n分别为字符串A和字符串B的长度+1。dp[i][j]的值表示A的前i个字符与B的前j个字符的距离。dp[i][j]的值是以下四种结果的最小值:
1.dp[i][j]=dp[i-1][j-1],此时已经知道A的前i-1个字符到B的前j-1个字符的距离且A[i]==B[j],不增加距离。
2.dp[i][j]=dp[i-1][j-1]+1,此时已经知道A的前i-1个字符到B的前j-1个字符的距离且A[i]!=B[j],需要修改A[i]或B[j],距离+1.
3.dp[i][j]=dp[i-1][j]+1,此时已经知道A的前i-1个字符到B的前j个字符的距离,那么A的前i个字符到B的前j个字符就需要加上A的第i个字符,即距离+1
4.dp[i][j]=dp[i][j-1]+1,此时已经知道A的前i个字符到B的前j-1个字符的距离,那么B的前j个字符到A的前i个字符就需要加上B的第j个字符,即距离+1
class stringDis{
public:
int dis(const string &a,const string &b){
int x=(int)a.size();
int y=(int)b.size();
int dis1,dis2,dis3;
vector<vector<int>> dp(x+1,vector<int>(y+1));
for(int i=0;i<=x;i++) dp[i][0]=i;
for(int i=0;i<=y;i++) dp[0][i]=i;
for(int i=1;i<=x;i++){
for(int j=1;j<=y;j++){
dis1=dp[i][j-1]+1;
dis2=dp[i-1][j]+1;
if(a.at(i-1)==b.at(j-1)) dis3=dp[i-1][j-1];
else dis3=dp[i-1][j-1]+1;
dp[i][j]=min(min(dis1,dis2),dis3);
}
}
return dp[x][y];
}
};
二维数组需要初始化第0行和第0列,表示空串到A和B的距离。