system design关于加index搜索(nosql DB)

问题定义

database是按uuid auto increase的int作为primary key。搜pk肯定不需要o(N)全表遍历,至少可以二分o(logn).

但有时候想搜某一性质的内容。比如姓名,比如车型,这样。遍历全表会很慢,如果是搜索频率比较高的性质,可以考虑做index,变成o(1) (hashmap) 或 o(logn), 提升搜索速度。

关系型数据库里,只要create index就好.

非关系型数据呢?

两种方法

1. Local Index

对每一个partition, 增加一个关于index的hashmap,这里用最简单的hash index为例子,key是想作index的那一类,比如员工姓/姓名,value是list of Primary Key. 比如:

王:1, 5, 7, 99, 。。

李:2, 12, 。。。

张明:108,222, 。。。

这样每一个partition都维护一个自己的hashmap

每在一个partition里写一个新数据,都在该partition的hashmap里相关index后面加上这个新pk。

那么如果我们想搜王姓员工,就要遍历(scatter)每一个partition 的hashmap, 拿到每一个的王姓的结果,再合在一起(gather)

应用

cassendra,mongoDB

2. Global Index

单独维护关于index的hashmap,和数据可以不在一个partition, 所有partition的数据共用一个hashmap (即global的index)。故只有一个王姓的key,所有结果都加在该key后面。

每在一个partition里写一个新数据,就在global hashmap里面相关的tag后面加上这个数据的pk。因为可能有很多相关index,且相关index可能不在同一Partition,所以。往往offline 异步进行。

只需要去global hashmap里面读一次,就是所有王姓的结果。

应用

DynamoDB,craigslist

<script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-7135538265369250"
     crossorigin="anonymous"></script>

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值