概览数据库索引

最新推荐文章于 2024-09-13 21:40:38 发布

小技术君

最新推荐文章于 2024-09-13 21:40:38 发布

阅读量928

点赞数 17

文章标签：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_37604985/article/details/135121238

版权

数据库表是一组行/记录。然而，这些行并不是以表的形式物理存储的，它们存储在块上的数据页中。要在这些数据页中找到特定记录需要扫描多个文件。为了改进这一点，我们创建索引。索引是小型的引用表，用于根据索引值存储对行的引用。

索引是一种使数据检索更快的数据库对象。但是，索引的创建也需要时间，并且会占用额外的空间。因此，在选择正确的索引创建策略时，我们必须审慎选择。

RUM猜想

类似于CAP定理，RUM猜想指出 —— 我们无法设计一个存储系统的访问方法，使其在以下三个方面都最优：

读、更新和内存。

1*SE6pT6rSk7pmdfarFrtUNg.png

1*uLJsLLeQtMoHbu3aQLnIEw.png

读取、更新、内存 — 以两者优化为代价的第三者。

读取开销： 定义为总读取数据量（主要 + 辅助）与预期读取的主要数据量之间的比率。通过读取放大来衡量。

更新开销： 定义为总写入数据量（主要 + 辅助）与预期更新的主要数据量之间的比率。通过写入放大来衡量。

根据上图中的读取和写入模式，数据库将分为以下5类：

•平衡 — 读取和写入均匀分布。很少发生。•读取优化 — 写入较少，读取较多（分析工作负载）•写入优化 — 写入较多，读取较少（事务工作负载）•热分区读取 — 来自某些数据部分的读取较多•热分区写入 — 向某些部分的写入较多

索引类型

无索引

实现：Kafka（可以看作纯粹是WAL）、数据仓库

主键索引

主键 = 分区键 + （可选）排序键

•分区键 = “什么节点”•排序键 = 满足唯一性约束的剩余内容

有各种分区策略，其中一些如下：

•哈希分区（也称为“一致性哈希”）•范围分区•随机数

聚簇索引 — 物理数据组织

非聚簇索引 — 逻辑组织

KV存储（哈希表）

•哈希分区在这里非常有意义•只能在RAM中进行，这就是为什么我们在PostgreSQL等数据库中看不到它•实现：Memcache、Redis

B树 — 读取优化

•实现：DynamoDB、PostgreSQL•变体：Bw-tree 等（查看 Alex Petrov 的《Database Internals》）•它是许多数据库中的默认索引。

1*7luQKKJbxALgXDcsxsyWuw.png

位图索引

用于OLAP的读取和内存优化。

1*5XDCdkSkwJHmZUzDaLja5w.png

LSM树 — 写入优化

•实现：Cassandra、Spanner

二级索引 — 更多读取优化

•本地二级索引 — 这是“默认”/“正常”的二级索引•全局二级索引 - 可能对于读取重型的键范围查询和无法避免的散列收集最有意义•实现：DynamoDB，可能是Spanner

多维索引

•连接索引•R树（实现：PostgreSQL）•四叉树（实现：Elasticsearch）•地理哈希（实现：Redis）

倒排索引

•实现：ElasticSearch、PostgreSQL、Redis•示例场景：Twitter 等社交媒体站点的文本搜索，google.com，GitHub

跳跃表

•实现：Redis（仅）•示例场景：游戏排行榜

向量索引

•实现：Pinecone、Facebook 的 Faiss、PlanetScale 的 MySQL 分支、Redis•示例场景：机器学习问题

数据立方体和物化视图

•实现：数据仓库，支持OLAP的数据库

Count-min sketch

•就RUM而言，以极端OLAP读取延迟为代价换取精度•实现：Flink、AWS Firehose、Druid、Spark streams、Redis

对于分布式系统，还有其他有趣的权衡。其中之一是PACELC，它说：如果是分区，选择可用性和一致性之间的折衷，否则选择延迟和一致性之间的折衷。有许多级别的一致性可供折衷选择（以及隔离级别）。

一致性级别

•强一致性•最终一致性•一致前缀•单调读取

关注

17
点赞
踩
24

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

小技术君 CSDN认证博客专家 CSDN认证企业博客

码龄8年

262: 原创

7万+: 周排名

1万+: 总排名

15万+: 访问

: 等级

3772: 积分

983: 粉丝

1408: 获赞

8: 评论

1568: 收藏

私信

关注

热门文章

分类专栏

Java 7篇
笔记 1篇
kafka 1篇
微服务 1篇

最新评论

微服务架构中的挑战及应对方式：Outbox 模式
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
通过示例理解 MapReduce | 系统设计
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
如何使用Apache Kafka处理1亿用户的大型应用程序
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
通过示例理解 MapReduce | 系统设计
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
通过示例理解 MapReduce | 系统设计
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小技术君 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。