索引技术
文章平均质量分 81
NoSQL漫谈
NoSQL主要泛指一些分布式的非关系型数据存储技术,这其实是一个非常广泛的定义,可以说涉及到分布式系统技术的方方面面。随着人工智能、物联网、大数据、云计算以及区块链技术的不断普及,NoSQL技术将会发挥越来越大的价值。
本博客聚焦于业界主流的开源NoSQL技术,内容主要涉及技术原理、技术观点以及最新的技术动态。
展开
-
Jeff Dean的Learned Index为数据库索引带来了哪些启发1
这篇论文在两个月前刚被公布出来的时候,因为带着Jeff Dean的署名曾一度被热传,但直到今天才认真读完这篇论文。Learned Index基于机器学习的方法,对传统数据库索引做了改造。本文先介绍Learned Index的RM-Index模型以及与B-Tree索引的对比。如论文开篇所言,可以将传统的数据库索引(Index)视为一种模型(Model):B-Tree索引B-Tree索引模型将一个Ke...原创 2018-03-09 13:07:11 · 2603 阅读 · 0 评论 -
Jeff Dean的Learned Index为数据库索引带来了哪些启发2
本文继续讨论Recursive Model Index(RM-Index)索引更新涉及的相关问题,以及Learned Index对Hash索引以及Bloom Filter索引如何进行改造来降低索引占用空间。RM-Index索引的更新上篇文章中关于RM-Index的设计以及与B-Tree索引的对比测试结果,主要针对只读场景的内存型数据库系统,也可以应用于更新频率较低的数据仓库系统中,对于Bigtab...原创 2018-03-09 13:08:55 · 1911 阅读 · 0 评论 -
HBase与时空索引技术
所谓时空数据,顾名思义,包含了两个维度的信息:空间信息与时间信息。空间信息,以地理位置点最为基础,还包括线、多边形以及更为复杂的多维结构。最典型的时空数据,莫过于移动对象的轨迹点数据,如每隔5秒钟记录的车辆实时位置信息。这类数据,在物联网领域司空见惯,在可预见的未来,这类数据将会出现爆炸性的增长。用HBase存放时空数据时空数据,尤其是移动对象位置点数据,结构简单,但关于吞吐量的要求却往往...原创 2019-02-20 23:27:11 · 3647 阅读 · 0 评论