difflib
:基于Ratcliff-Obershelp算法(格式塔模式匹配)
fuzzywuzzy
:基于莱文斯坦距离(需要安装python-Levenshtein)
https://blog.csdn.net/lly1122334/article/details/107024341
文本向量化,余弦相似度
https://zhuanlan.zhihu.com/p/351780276
1. 余弦相似度
2. 欧氏距离
3. 曼哈顿距离
4. 切比雪夫距离
5. 杰尔德距离
6. 汉明距离
7. 标准化欧式距离
8. 皮尔逊相关系数