最近看到有人在找关于文本比较的算法,刚好最近休假,研究了一下,终于找到一个简单有效的算法,和大家分享一下。
算法本身很简单,但是要说清楚思路和原理就比较复杂了,打算分两次发表(明天就要上班拉!),分别对应文本比较算法中的两个主要问题:
1。如何确定最大匹配率;
2。如何确定最优的匹配路径;
算法本身是基于图论的,太麻烦了,所以不打算介绍整个思路,只将最后的结果详细解说给大家。有问题可以发邮件给我:Calriones@hotmail.com
文本比较算法剖析(1)-如何确定最大匹配率
1. 首先,我们假设有两个串left和right,
left="ABCACADF"
&