Python实现的十多种字符相似度算法

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/stupid_3/article/details/80766972

最近因为工作需要,使用Python实现了常用的字符串相似度算法,一共超过十种。列举如下:

  • Levenshtein
  • NormalizedLevenshtein
  • WeightedLevenshtein
  • DamerauLevenshtein
  • OptimalStringAlignment
  • Jarowinkler
  • LongestCommonSubsequence
  • MetricLongestCommonSubsequence
  • NGram
  • QGram
  • Cosine
  • Jaccard
  • SorenceDice

详见GitHub: luozhouyang/python-string-similarity

展开阅读全文

没有更多推荐了,返回首页