python搜索算法_实现基本高效的“搜索”算法：Python

最新推荐文章于 2023-03-18 01:32:50 发布

知乎圈子

最新推荐文章于 2023-03-18 01:32:50 发布

阅读量745

点赞数

文章标签： python搜索算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28872105/article/details/113982574

版权

你的算法在一般的输入上执行得很慢。假设您有10个搜索词和包含10000个单词的文本。在这种情况下，每个术语都可能有1000个索引。最终将产生1000^10个总可能性。在

就big-O表示法而言，复杂度是O((n/k)^k)，其中n是文本中的项数，k是搜索项的数目。在

这是idea更快的算法。在逐字迭代文档时，我们需要跟踪最接近当前位置的搜索词索引。我们将此结构称为lookup(简单python的dict)。简单示例："hello there my name is dominic and >my< name is very special"

假设我们要访问突出显示的“我的”单词。此时查找是{“my”：2，“dominic”：5}。当前的“我的”将更接近文本中的任何其他单词。所以当访问下一个单词(“name”)时，我们将更新版本{“my”：7，“dominic”：5}。很容易看出，最优解对应于查找状态之一。所以要得到答案，只需跟踪字典中值的max()-min()。注意：只有当所有搜索项都将作为查找键出现时，才应该开始跟踪。在

在每次搜索项出现时，我们需要迭代位置查找中的k值，因此该算法的复杂度为O(nk)。在

为了使其更好，您还可以将balanced BST与lookup中的索引一起使用。现在，您可以在O(logk)中检索min index，而不是迭代查找值(O(k))：

^{pr2}$

在这种情况下，总复杂度为O(nlogk)。在

编辑。没有树优化的代码(在Python中没有找到内置的BST)：document = "hello there my name is domi

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python搜索算法_实现基本高效的“搜索”算法：Python

你的算法在一般的输入上执行得很慢。假设您有10个搜索词和包含10000个单词的文本。在这种情况下，每个术语都可能有1000个索引。最终将产生1000^10个总可能性。在就big-O表示法而言，复杂度是O((n/k)^k)，其中n是文本中的项数，k是搜索项的数目。在这是idea更快的算法。在逐字迭代文档时，我们需要跟踪最接近当前位置的搜索词索引。我们将此结构称为lookup(简单python的dic...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。