Python yield 迭代访问mongo

最新推荐文章于 2022-02-28 09:24:14 发布

dutsoft

最新推荐文章于 2022-02-28 09:24:14 发布

阅读量791

点赞数 1

分类专栏： Python基础文章标签： Python Mongo yield

本文链接：https://blog.csdn.net/dutsoft/article/details/79089407

版权

在MongoDB中，使用limit和skip方法处理大量数据时，skip操作的性能较低。由于索引不支持skip的排名计算，导致效率低下。为了解决这一问题，可以采用Python的yield生成器，分段存储_id并逐次访问Mongo集合，以提高遍历效率。

摘要由CSDN通过智能技术生成

mongo中使用limit()方法来读取指定数量的数据，使用skip()方法来跳过指定数量的数据。但skip时是一条条遍历过来的，在数据量较大时，skip性能堪忧。慢的根本原因在于：“索引所依赖的b+结构不能用于排名计算”。
在某些需要遍历全表分段取数据的场景，我们可以暂存一个_id，通过yield的方式来访问mongo集合，规避skip的使用。

# 迭代方式访问mongo
def find_iter(collcetion, limit=100, spec={}):
    min_id = list(collcetion.find(spec).sort('_id', 1).limit(1))[0]['_id']
    max_id = list(collcetion.find(spec).sort('_id', -1).limit(1)

最低0.47元/天解锁文章

dutsoft

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python yield 迭代访问mongo

mongo中使用limit()方法来读取指定数量的数据，使用skip()方法来跳过指定数量的数据。但skip时是一条条遍历过来的，在数据量较大时，skip性能堪忧。慢的根本原因在于：“索引所依赖的b+结构不能用于排名计算”。在某些需要遍历全表分段取数据的场景，我们可以暂存一个_id，通过yield的方式来访问mongo集合，规避skip的使用。# 迭代方式访问mongodef find_
复制链接

扫一扫

专栏目录