有序匹配算法:
1、编辑距离算法(Levenshtein Distance) 。
2、LCS算法(Longest Common Subsequences)。时间复杂度O(m+n)。
对相同字符串,LD和LCS算法计算出的相似度不同。
无序匹配算法:
1、GST(Greeding String Tiling)。时间复杂度:最好为O(n2),最差为O(n3)。
2、RKR-GST(Running Karp-Rabin Greeding String Tiling)。时间复杂度:最好为O(n),最差为O(n3)。
对相同字符串,GST和RKR-GST计算出的相似度相同。