![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
工作笔记
文章平均质量分 88
若呓
一个致力于分布式数据库内核的小白,最近在钻研算法和扩展知识广度,暂时随手博客更新于此,希望能帮助到你,也希望大家和我一起交流。
展开
-
BASE基本可用
本篇文章以数据库研发的视角开始,角度可能些许刁钻或者偏激,还请指正。原创 2024-02-28 18:23:58 · 859 阅读 · 0 评论 -
《Access Path Selectionin a Relational Database Management System》论文笔记
在实际的数据库查询优化中,优化器会考虑多种因素来选择最佳的连接策略,包括表的大小、索引的存在、连接列的排序状态以及内存的可用量。优化器还会使用统计信息来更精确地估计成本和选择率,从而生成一个总体成本最低的查询执行计划。原创 2024-01-31 18:50:10 · 1399 阅读 · 0 评论 -
分布式场景怎么Join
举个例子,有一张非常小的表A,还有一张按照ID分片的表B,我们可以在每一个物理库中复制一份表A,这样我们的Join操作就可以直接下推到每一个数据库操作了。在ShardingSphere中,这种场景类似于绑定表的定义,如果两张表的算法相同,可以直接配置绑定表的关系,进行相同算法的连接查询,避免复杂的笛卡尔积。在分布式环境中,Sort-Merge Join首先在每个节点上对数据进行局部排序,然后将排序后的数据合并起来,最后在合并的数据上执行联接操作。对于已经排序的数据集或数据分布均匀的情况,这种方法非常有效。原创 2024-01-30 17:36:53 · 1539 阅读 · 0 评论