字符串相似度

最新推荐文章于 2024-08-12 19:18:27 发布

champin0904

最新推荐文章于 2024-08-12 19:18:27 发布

阅读量248

点赞数

分类专栏：技术难题文章标签： distance 算法 string 测试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/champin0904/article/details/7001009

版权

技术难题专栏收录该内容

2 篇文章 0 订阅

订阅专栏

此篇只是个整理，参考了如下链接：

http://www.linuxso.com/architecture/9008.html

最近在考虑如何求字符串相似度计算的问题，查了很多，有两种方式

1.向量

/**

* 计算字符串相似度

* @return

*/

public static double computeSimilarity(String str, String compareTo) {

char[] strChars = str.toCharArray();

char[] compareToChars = compareTo.toCharArray();

long vecProduct = 0;

long strProduct = 0;

long compareToProduct = 0;

double strCharsAbs = 0.0;

double compareToCharsAbs = 0.0;

double strSimilarity = 0.0;

int vecLen = 0;

if(str.length() <= compareTo.length()) {

vecLen = str.length();

} else {

vecLen = compareTo.length();

}

for(int i = 0; i < vecLen; i++) {

vecProduct += strChars[i] * compareToChars[i];

}

for(int i = 0; i < str.length(); i++) {

strProduct += strChars[i] * strChars[i];

}

strCharsAbs = Math.sqrt(strProduct);

for(int i = 0; i < compareTo.length(); i++) {

compareToProduct += compareToChars[i] * compareToChars[i];

}

compareToCharsAbs = Math.sqrt(compareToProduct);

strSimilarity = vecProduct / (strCharsAbs * compareToCharsAbs);

return strSimilarity;

}

这个算法我是按照向量夹角公式实现的，但是在测试的时候是存在很大问题的，

比如“abc“，”def“完全不相同的两个字符串相似度是99％，后来发现我是按照它们的asc码作为

它们的向量值的，所以才会出现这样的结果，希望哪位大虾可以帮忙改正

2.Levenshtein distance 算法

这个算法满足了我的要求，具体可以参考链接中的原文

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
字符串相似度

此篇只是个整理，参考了如下链接：http://www.linuxso.com/architecture/9008.html最近在考虑如何求字符串相似度计算的问题，查了很多，有两种方式1.向量 /** *计算字符串相似度 *@return */ publicstaticdouble computeSimilarity(String
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。