相似度 java_java – 相似度得分 – Levenshtein

The 07000 distance between two strings is defined as the minimum number of edits needed to transform one string into the other, with the allowable edit operations being insertion, deletion, or substitution of a single character. (Wikipedia)

所以Levenshtein距离为0意味着:两条线都相等

>最大Levenshtein距离(所有字符不同)为max(string1.length,string2.length)

所以如果你需要一个百分比,你必须使用这个来指数。例如:

“Hallo”,“Hello” – >莱文斯坦距离1

这两个字符串的Max Levenstein距离是:5。

所以20%的字符不匹配。

String s1 = "Hallo";

String s2 = "Hello";

int lfd = calculateLevensteinDistance(s1, s2);

double ratio = ((double) lfd) / (Math.max(s1.length, s2.length));

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值