python 比较两个序列的相似度，不需要分词

最新推荐文章于 2024-02-23 14:46:08 发布

xyqzki

最新推荐文章于 2024-02-23 14:46:08 发布

阅读量1.4w

点赞数 2

分类专栏： python 文章标签： python

python 专栏收录该内容

43 篇文章 1 订阅

订阅专栏

code

通过Python来判断2个文字列的相似度的多少，合理使用的话就可以实现Google等搜索引擎中的 你是不是要找 的功能了。

import difflib
a=u'阿里巴巴'
b=u'阿里爸爸'
print difflib.SequenceMatcher(None,a,b).ratio()

0.75

返回的结果超过0.6就算很相似。看来目前完全人肉做近义词词典的工作有一部分可以自动化来实现了。

ref

http://pymotw.com/2/difflib/
http://jianslog.appspot.com/tag/Python
http://jianslog.appspot.com/tag/Python

优惠劵

xyqzki

关注关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
python 比较两个序列的相似度，不需要分词

code通过Python来判断2个文字列的相似度的多少，合理使用的话就可以实现Google等搜索引擎中的你是不是要找的功能了。import diffliba=u'阿里巴巴'b=u'阿里爸爸'print difflib.SequenceMatcher(None,a,b).ratio()0.75返回的结果超过0.6就算很相似。看来目前完全人肉做近义词词典的工作有一部分可以自动化来实现了。ref
复制链接

扫一扫