1. window安装
(1) https://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载对应的包
python_Levenshtein‑0.12.0‑cp27‑cp27m‑win32.whl
python\_Levenshtein‑0.12.0‑cp27‑cp27m‑win\_amd64.whl
根据自己的平台选择下载
(2) 启动cmd,进入Levenshtein的下载目录
(3) 在cmd下输入
pip install python_Levenshtein‑0.12.0‑cp27‑cp27m‑win_amd64.whl
2. linux安装
pip install python-Levenshtein
3. Levenshtein介绍
1). Levenshtein.hamming(str1, str2): 计算汉明距离--是描述两个等长字串之间对应位置上不同字符的个
数。要求str1和str2必须长度一致。
2). Levenshtein.distance(str1, str2): 计算编辑距离(也称为Levenshtein距离)--是描述由一个字串转化成
另一个字串最少的操作次数,在其中的操作包括插入、删除、替换。
3). Levenshtein.ratio(str1, str2): 计算莱文斯坦比。计算公式r = (sum - ldist) / sum, 其中sum是指str1
和 str2 字串的长度总和,ldist是类编辑距离。注意 :这里的类编辑距离不是2中所说的编辑距离,2中
三种操作中每个操作+1,而在此处,删除、插入依然+1,但是替换+2。这样设计的目的:ratio('a',
'c'),sum=2, 按2中计算为(2-1)/2 = 0.5,’a','c'没有重合,显然不合算,但是替换操作+2,就可以解
决这个问题。
4). Levenshtein.jaro(str1, str2): 计算jaro距离。
5). Levenshtein.jaro_winkler(str1, str2)