python如何寻找两个相似的文件_Python使用sklearn查找两个文档之间所有相似的句子...

最新推荐文章于 2021-02-23 14:20:03 发布

weixin_39803977

最新推荐文章于 2021-02-23 14:20:03 发布

阅读量208

点赞数

文章标签： python如何寻找两个相似的文件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39803977/article/details/113975621

版权

我试图返回两个文档之间所有相似的句子，我的解决方案是有效的，但速度非常慢。有没有更有效的方法来实现这一点？在

我打开两个文档(A和B)，并使用NLTK将两个文档中的每个句子提取到list_A和list_B(fast)。从那里，我循环查看列表_u a中的每个句子，并将每个句子与列表_b中的所有句子进行比较(慢)。如果这两个句子在百分比上是相似的，我会将类似的句子附加到结果列表中，以便以后查看。在

我用来比较两个句子的代码：# Compare two sentences

def compare_sentences( sentences_a, sentences_b ):

# Init our vectorizer

vect = TfidfVectorizer( min_df = 1 )

# Create our tfidf

tfidf = vect.fit_transform( [ sentences_a, sentences_b ] )

# Get an array of results

results = ( tfidf * tfidf.T ).A

# Return percentage float

return float( '%.4f' % ( results[0][1] * 100 ) )

# end compare_sentences()

我已经看到了很多有用的答案，描述了如何在一般意义上比较两个文档，但是我想找到一个解决方案，提供两个文档之间所有相似句子的列表。在

谢谢你的帮助。在

weixin_39803977

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python如何寻找两个相似的文件_Python使用sklearn查找两个文档之间所有相似的句子...

我试图返回两个文档之间所有相似的句子，我的解决方案是有效的，但速度非常慢。有没有更有效的方法来实现这一点？在我打开两个文档(A和B)，并使用NLTK将两个文档中的每个句子提取到list_A和list_B(fast)。从那里，我循环查看列表_u a中的每个句子，并将每个句子与列表_b中的所有句子进行比较(慢)。如果这两个句子在百分比上是相似的，我会将类似的句子附加到结果列表中，以便以后查看。在我用来...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。