计算字符串的编辑距离

Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。

如bankcomm和bocomm的距离为3,只要将‘o'改为’a'再增加‘nk’,bocomm就和bankcomm相同。所以距离为3

利用动态规划求解:

建立一个二维数组dp[m][n],m和n分别为字符串A和字符串B的长度+1。dp[i][j]的值表示A的前i个字符与B的前j个字符的距离。dp[i][j]的值是以下四种结果的最小值:

1.dp[i][j]=dp[i-1][j-1],此时已经知道A的前i-1个字符到B的前j-1个字符的距离且A[i]==B[j],不增加距离。

2.dp[i][j]=dp[i-1][j-1]+1,此时已经知道A的前i-1个字符到B的前j-1个字符的距离且A[i]!=B[j],需要修改A[i]或B[j],距离+1.

3.dp[i][j]=dp[i-1][j]+1,此时已经知道A的前i-1个字符到B的前j个字符的距离,那么A的前i个字符到B的前j个字符就需要加上A的第i个字符,即距离+1

4.dp[i][j]=dp[i][j-1]+1,此时已经知道A的前i个字符到B的前j-1个字符的距离,那么B的前j个字符到A的前i个字符就需要加上B的第j个字符,即距离+1

class stringDis{
public:
    int dis(const string &a,const string &b){
        int x=(int)a.size();
        int y=(int)b.size();
        int dis1,dis2,dis3;
        vector<vector<int>> dp(x+1,vector<int>(y+1));
        for(int i=0;i<=x;i++) dp[i][0]=i;
        for(int i=0;i<=y;i++) dp[0][i]=i;
        for(int i=1;i<=x;i++){
            for(int j=1;j<=y;j++){
                dis1=dp[i][j-1]+1;
                dis2=dp[i-1][j]+1;
                if(a.at(i-1)==b.at(j-1)) dis3=dp[i-1][j-1];
                else dis3=dp[i-1][j-1]+1;
                dp[i][j]=min(min(dis1,dis2),dis3);
            }
        }
        return dp[x][y];
    }
};

二维数组需要初始化第0行和第0列,表示空串到A和B的距离。

 

 

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值