MongoDB分页处理方案

最新推荐文章于 2024-08-19 02:28:21 发布

残忍的刀刀

最新推荐文章于 2024-08-19 02:28:21 发布

阅读量3.5k

点赞数

分类专栏： nosql 文章标签： mongodb 分页数据结构客户体验

本文链接：https://blog.csdn.net/dan_coder/article/details/11799199

版权

MongoDB的分页性能在大数据量下可能成为瓶颈，主要原因是数据筛选和排序。Google通过估算结果数和限制展示数据量来优化。解决方案包括：1) 类Google式的性能与用户体验折中，估算匹配数据量；2) 限定翻页页数，避免大量数据扫描；3) 使用缓存策略，以空间换取时间，存储关键索引信息。

摘要由CSDN通过智能技术生成

MongoDB的分页性能是广大使用者所诟病的大问题之一，在大数据量环境下，如果一次跳转的页数过多，如10W多页，可能用户要等上几十秒（瞎掰的数据），有兴趣的可以去看一下这篇文章Paging& Ranking With Large Offsets: MongoDB vs Redis vsPostgreSQL。

看完了你是不是对MongoDB的性能很失望，对Redis充满了崇敬？

其实这种对比是完全不公平的。

首先，看一下Redis，研究NoSQL的多少会了解一些吧，这是一种完全的内存缓存的存储系统，他完全称不上是个数据库，为什么这么说呢，因为数据库最基本的一个特征——持久化Redis是没有的。Redis和Memcached一样，是一种将数据全部放在内存中用于缓存的存储系统，因此它的性能就是内存的性能。

而MongoDB，乃至其他一切数据库，都会将数据存入硬盘，虽然MongoDB也会将部分热数据放入内存，但是面对千万级甚至上亿的数据量，让内存放下所有热数据是不可能的，所以如果一个查询匹配的数据过多的话，可能大部分的性能瓶颈都在页面交换（从硬盘上读数据）上了。

最后，你可以测一下关系型数据库的性能，相信很难有哪个关系型数据库的分页性能比MongoDB还好。

当然，这不是为MongoDB开脱，我认为10gen应该找到一些办法来优化一下这种分页之后大偏移量的性能严重下降问题，虽然我还没想到。

数据库性能瓶颈分析

出现这一现象的原因，在于用户的这种查询需要数据库根据条件做一次筛选或排序，这是非常耗时间的，比如：

db.user.find({age:{$gt:20, $lt:30}}).sort({registdate:1,name:-1})

你如果在Google的用户数据中（据说是亿级）进行了这种查询，假设这些数据使用MongoDB（实际应该是BigTable）存储的，匹配了上亿的数据量，这个过程，MongoDB需要一个compound index，类似于{age:1, registdate:1, name:-1}这种，首先要根据age过滤出符合{age:{$gt:20,$lt:30}}的数据，然后根据两个条件{ registdate:1, name:-1}进行排序，这个排序很可能会与原来的索引顺序不同，因此MongoDB需要花时间来进行这种排序操作，更重要的是基于内存大小的限制，这种排序的结果不可能用于存储在内存中，甚至不会记录而是每次都排序一遍（这是很正常的），如果你查询的是前一百条的数据还好，MongoDB也许只需要排序数百条数据就能返回排序好的前一百。

举个例子，减小一下数据规模，如下图：

MongoDB分页处理方案（适用于一般数据库的分页方法）