在项目中遇到一个问题需要计算两个字符串的相似度,查找了一下常用的方法例如计算海明距离,编辑距离等,最后准备使用编辑距离来做第一个版本;
python里有写好的可用的库,python-Levenshtein;
关于该库里面的函数的介绍参考:
https://blog.csdn.net/iloveyin/article/details/17419617(中文,简要) |
http://www.coli.uni-saarland.de/courses/LT1/2011/slides/Python-Levenshtein.html#Levenshtein-inverse(英文,全) |
安装过程:
1.pip install python-Levenshtein 或 下载包到本地,在cd到目录下运行 python setup.py install
我用的是第二种方式;
2.此过程中报错 unable to find vcvarsall.bat;
详细解决方案见:https://blog.csdn.net/fyuanfena/article/details/52038917
3.我选择了安装 vcforpython27.msi,下载网址: