计算字符串的相似度

编辑距离: Edit Distance,又称Levenshtein距离,是指一个字符串经过增加、删除、修改后操作转变成另一个字符串所需要的最小操作次数。
相似度:等于“编辑距离+1”的倒数。所以编辑距离越小,相似度越大。

如s1 = “abc”,s2 = “ab”,其编辑距离为1,相似度为1/(1+1) = 0.5

问题:给定两个字符串,计算其相似度

解决方法:利用动态规划,先计算两个字符串的编辑距离,相似度也就很容易的得出来了

#include <iostream>
#include <string.h>
#include <math.h>

using namespace std;

int main()
{
    string s, t;
    cin >> s;
    cin >> t;
    int len_s = s.length();
    int len_t = t.length();

    int dp[len_s+1][len_t+1] = {0};
    //预处理、初始化
    for(int i = 0; i <= len_s; ++i){
        dp[i][0] = i;
    }
    for(int i = 0; i <= len_t; ++i){
        dp[0][i] = i;
    }

    for(int i = 1; i <= len_s; ++i){
        for(int j = 1; j <= len_t; ++j){
            if(s[i-1] == t[j-1]){
                dp[i][j] = dp[i-1][j-1];
            }
            else{
                dp[i][j] = 1 + min(dp[i-1][j-1], min(dp[i-1][j], dp[i][j-1]));
            }

            cout << dp[i][j] << endl;
        }
    }

    int editDist = dp[len_s][len_t];
    double similarity = 1.0/(editDist+1);

    cout << similarity << endl;
    return 0;
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值