system design关于加index搜索（nosql DB）

玉沙丘魔

已于 2022-02-08 01:48:54 修改

阅读量857

点赞数

文章标签： nosql 数据库 database 后端分布式

于 2022-02-05 13:39:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62384387/article/details/122789715

版权

问题定义

database是按uuid auto increase的int作为primary key。搜pk肯定不需要o(N)全表遍历，至少可以二分o(logn).

但有时候想搜某一性质的内容。比如姓名，比如车型，这样。遍历全表会很慢，如果是搜索频率比较高的性质，可以考虑做index，变成o(1) (hashmap) 或 o(logn), 提升搜索速度。

关系型数据库里，只要create index就好.

非关系型数据呢？

两种方法

1. Local Index

对每一个partition, 增加一个关于index的hashmap，这里用最简单的hash index为例子，key是想作index的那一类，比如员工姓/姓名，value是list of Primary Key. 比如：

王：1， 5， 7， 99，。。

李：2， 12，。。。

张明：108，222，。。。

这样每一个partition都维护一个自己的hashmap。

写

每在一个partition里写一个新数据，都在该partition的hashmap里相关index后面加上这个新pk。快

读

那么如果我们想搜王姓员工，就要遍历(scatter)每一个partition 的hashmap, 拿到每一个的王姓的结果，再合在一起(gather)。慢

应用

cassendra，mongoDB

2. Global Index

单独维护关于index的hashmap，和数据可以不在一个partition, 所有partition的数据共用一个hashmap (即global的index）。故只有一个王姓的key，所有结果都加在该key后面。

写

每在一个partition里写一个新数据，就在global hashmap里面相关的tag后面加上这个数据的pk。因为可能有很多相关index，且相关index可能不在同一Partition，所以慢。往往offline 异步进行。

读

只需要去global hashmap里面读一次，就是所有王姓的结果。快。

应用

DynamoDB，craigslist

<script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-7135538265369250"
crossorigin="anonymous"></script>

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。