分布式架构关于数据分页问题

最新推荐文章于 2023-05-23 12:15:00 发布

予亭

最新推荐文章于 2023-05-23 12:15:00 发布

阅读量4.5k

点赞数

分类专栏：分布式知识文章标签：分布式架构 elasticsearch

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/randompeople/article/details/116724374

版权

分布式知识专栏收录该内容

12 篇文章 1 订阅

订阅专栏

分页问题

100个数据，一页显示20个，有5页，这个数据量在常规的单台mysql 库中还是比较容易出结果的，比较常见的做法就是：

limit 20,40
a> 20 limit 20

但是对于分布式系统来说，数据都是存在多个系统里，那么分页就不是这么简单处理的，典型的elasticsearch、分布式数据库分页，本文将通过elasticsearch的分页来了解分布式环境下的分页方案。

分布式数据分页：全局分页

100个数据负载均衡之后分到了5个库里，然后如何通过对5个数据排序就很难搞了，可能需要从每一个库里找到20个数据，排序然后再截取数据返回，可是如果数据量比较大，比如：我们每次要查10000个数据，第一页还很简单，越到后面查询的数据就越多，但只是为了10000条数据，每一个库都要给10000条数据返回总结点，总节点再排序得到10000条全局的数据。

分布式系统分页解决方法

浅分页 from + size
这个跟数据库的limit功能一样的，不过不适合深分页。
深分页search after
search_after 分页的方式是根据上一页的最后一条数据来确定下一页的位置，同时在分页请求的过程中，如果有索引数据的增删改查，这些变更也会实时的反映到游标上。但是需要注意，因为每一页的数据依赖于上一页最后一条数据，所以无法跳页请求。为了找到每一页最后一条数据，每个文档必须有一个全局唯一值，官方推荐使用 _uid 作为全局唯一值，其实使用业务层的 id 也可以。
scroll 游标轮询
scroll 类似于sql中的cursor，使用scroll，每次只能获取一页的内容，然后会返回一个scroll_id。根据返回的这个scroll_id可以不断地获取下一页的内容，所以scroll并不适用于有跳页的情景，太消耗资源了，所以不建议使用。

参考博客

分布式数据库的分页方案
 业界难题-“跨库分页”的四种方案
 ES分页看这篇就够了

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分布式架构关于数据分页问题

分布式数据库的分页方案业界难题-“跨库分页”的四种方案ES分页看这篇就够了
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。