python 文本相似度_用Python计算文本的相似度

最新推荐文章于 2024-07-31 03:38:23 发布

weixin_39551993

最新推荐文章于 2024-07-31 03:38:23 发布

阅读量1k

点赞数

文章标签： python 文本相似度

本文介绍了Python中计算文本相似度的几种方法，包括difflib库的SequenceMatcher、Levenshtein库的ratio和distance函数，以及fuzzywuzzy库的模糊匹配。还提到了diff_match_patch库用于计算文本差异和相似度的方式。

摘要由CSDN通过智能技术生成

本文最后更新于2014年11月8日，已超过 1 年没有更新，如果文章内容失效，还请反馈给我，谢谢！

用Python计算文本的相似度

因为后期会需要用到这方面的知识，所以先提前准备准备；如何判断网页返回内容的相似度？

找到了几个Python的方法和库：

还有高大上的“TF-IDF方法”{之前在《数学之美》中看到过，但这里我就不考虑了}

下面主要记录用不同的Python库来计算两段文本之间的相似度（最后要得到的就是一个百分比）：

方法一：difflib

>>> import difflib

>>> difflib.SequenceMatcher(None, 'abcde', 'abcde').ratio()

1.0

>>> difflib.SequenceMatcher(None, 'abcde', 'zbcde').ratio()

0.80000000000000004

>>> difflib.SequenceMatcher(None, 'abcde', 'zyzzy').ratio()

0.0

方法二：Levenshtein

import Levenshtein 报错：ImportError: No module named Levenshtein

于是去：python-Levenshtein 下载源码进行安装（在http://www.lfd.uci.edu/~gohlke/pythonlibs/#python-levenshtein 其实也有编译好的exe），第一次安

最低0.47元/天解锁文章

weixin_39551993

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python 文本相似度_用Python计算文本的相似度

本文最后更新于2014年11月8日，已超过 1 年没有更新，如果文章内容失效，还请反馈给我，谢谢！用Python计算文本的相似度因为后期会需要用到这方面的知识，所以先提前准备准备；如何判断网页返回内容的相似度？找到了几个Python的方法和库：还有高大上的“TF-IDF方法”{之前在《数学之美》中看到过，但这里我就不考虑了}下面主要记录用不同的Python库来计算两段文本之间的相似度（最后要得到的...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。