- 博客(3)
- 收藏
- 关注
转载 HBase篇(5)- BloomFilter
【每日五分钟搞定大数据】系列,HBase第五篇。上一篇我们落下了Bloom Filter,这次我们来聊聊这个东西。 Bloom Filter 是什么? 先简单的介绍下Bloom Filter(布隆过滤器)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,缺点是有...
2018-11-13 09:34:00 122
转载 HBase篇(4)-你不知道的HFile
【每日五分钟搞定大数据】系列,HBase第四篇 这一篇你可以知道, HFile的内部结构? HBase读文件细粒度的过程? HBase随机读写快除了MemStore之外的原因? 上一篇中提到了Hbase的数据以HFile的形式存在HDFS, 物理存储路径是: NameSpace->Table->Region->CF->HFile 这一篇我们来说下这个HFil...
2018-11-08 09:23:00 135
转载 HBase篇(3)-架构详解
【每日五分钟搞定大数据】系列,HBase第三篇 聊完场景和数据模型我们来说下HBase的架构,在网上找了张比较清晰的图,我觉得这张图能说明很多问题,那这一篇我们就重点来解析下这张图 角色与职责 先介绍下上图中的几个角色和Ta们的职责: 1.HMaster 为Region server分配region; 负责Region server的负载均衡; 发现失效的Region serv...
2018-11-02 09:19:00 73
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人