c#
文章平均质量分 76
华夏之风
牛逼程序员
展开
-
[转]字符串相似度算法(编辑距离算法 Levenshtein Distance)[附c#,asp源码]
转载至:http://www.cnblogs.com/ivanyb/archive/2011/11/25/2263356.html 编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数,如果它们的距离越大,说明它们越是不同。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。 例如将ki转载 2013-02-28 09:31:26 · 687 阅读 · 0 评论 -
Levenshtein Distance(LD)-计算两字符串相似度算法
两字符串相似度计算方法有好多,现对基于编距的算法的相似度计算自己总结下。 简单介绍下Levenshtein Distance(LD):LD 可能衡量两字符串的相似性。它们的距离就是一个字符串转换成那一个字符串过程中的添加、删除、修改数值。 举例: 如果str1="test",str2="test",那么LD(str1,str2) = 0。没有经过转换。 如果st转载 2013-02-28 09:34:36 · 482 阅读 · 0 评论 -
C#计算两个字符串的相似度
我们在做数据系统的时候,经常会用到模糊搜索,但是,数据库提供的模糊搜索并不具备按照相关度进行排序的功能。 现在提供一个比较两个字符串相似度的方法。 通过计算出两个字符串的相似度,就可以通过Linq在内存中对数据进行排序和筛选,选出和目标字符串最相似的一个结果。 本次所用到的相似度计算公式是 相似度=Kq*q/(Kq*q+Kr*r+Ks*s) (Kq > 0 , Kr>=0,Ka>=0)转载 2013-02-28 09:55:10 · 1488 阅读 · 0 评论