关闭

python 比较两个序列的相似度,不需要分词

标签: python
2339人阅读 评论(1) 收藏 举报
分类:

code

通过Python来判断2个文字列的相似度的多少,合理使用的话就可以实现Google等搜索引擎中的 你是不是要找 的功能了。

import difflib
a=u'阿里巴巴'
b=u'阿里爸爸'
print difflib.SequenceMatcher(None,a,b).ratio()

0.75

返回的结果超过0.6就算很相似。看来目前完全人肉做近义词词典的工作有一部分可以自动化来实现了。

ref

http://pymotw.com/2/difflib/
http://jianslog.appspot.com/tag/Python
http://jianslog.appspot.com/tag/Python

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:781681次
    • 积分:11335
    • 等级:
    • 排名:第1427名
    • 原创:444篇
    • 转载:182篇
    • 译文:0篇
    • 评论:24条
    最新评论