计算文本相似度_Python文本相似性计算

最新推荐文章于 2024-05-10 05:15:00 发布

黄禹惜

最新推荐文章于 2024-05-10 05:15:00 发布

阅读量457

点赞数

文章标签：计算文本相似度

本文链接：https://blog.csdn.net/weixin_28849465/article/details/112612077

版权

安装simtext库

pip install simtext

上文本相似性计算代码

from simtext import similaritytextA = '批量爬取网页，需要根据网页之间URL的规律，利用Python格式化输出的format用法，来构造每页的URL。下面以豆瓣小说的URL为例，来展示批量爬取网页URL的构建'textB = '批量爬取网页，我们应该根据网页之间URL的规律，利用Python格式化输出的format用法，来构造每页的URL。我们以豆瓣小说的URL为例，来构建批量爬取网页的URL'sim = similarity()resp = sim.compute(textA, textB)print(resp)

上Jupyter Notebook返回结果
{'Sim_Cosine': 0.9232476577353843, 'Sim_Jaccard': 0.7916666666666666, 'Sim_MinEdit': 8, 'Sim_Simple': 0.9935404267673101}
文本相似性指标含义
Sim_Cosine：

最低0.47元/天解锁文章

黄禹惜

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
计算文本相似度_Python文本相似性计算

安装simtext库pip install simtext上文本相似性计算代码from simtext import similaritytextA = '批量爬取网页，需要根据网页之间URL的规律，利用Python格式化输出的format用法，来构造每页的URL。下面以豆瓣小说的URL为例，来展示批量爬取网页URL的构建'textB = '批量爬取网页，我们应该根据网页之间URL的规律，利用Py...
复制链接

扫一扫