编辑距离
用于计算序列之间编辑距离和对齐的python模块。
我需要一种方法来计算python中序列之间的编辑距离。我没有
能够找到任何合适的库来实现这一点,所以我自己编写了一个。在那里
似乎有许多可用于计算编辑的编辑距离库
两个字符串之间的距离,但不是两个序列之间的距离。
这完全是用python编写的。这种实现可能是
在python中优化为更快。如果
在C中实现。
库API是根据difflib.sequencematcher建模的。这很相似
到difflib,除了此模块计算编辑距离(levenshtein
而不是python的difflib的ratcliff和oberhelp方法
使用。difflib“不产生最小的编辑序列,但是倾向于产生
与人的“正确外观”匹配。“
如果你觉得这个图书馆有用或有什么建议,请给我寄一个
信息。
安装和卸载
最简单的安装方法是使用pip:pip install edit_distance
或者,您可以克隆此git repo并使用distutils安装:git clone [email protected]:belambert/edit_distance.git
cd edit_distance
python setup.py install
使用pip卸载:pip uninstall edit_distance
API使用
这需要python 2.7+,