![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
HBase
Jsoooo
这个作者很懒,什么都没留下…
展开
-
大数据相关-笔/面试题
Hadoop面试题:https://blog.csdn.net/kingmax54212008/article/details/51257067?utm_source=blogxgwz2Hadoop笔试题:https://blog.csdn.net/zhongqi2513/article/details/78349083Spark面试题:https://blog.csdn.net/wei...转载 2018-10-20 14:04:32 · 246 阅读 · 0 评论 -
HBase-批量处理操作
1.直接先来看一个API实例:控制台结果:原创 2019-01-12 19:05:58 · 2368 阅读 · 0 评论 -
HBase-协处理器(Coprocessor)
1.协处理器概念 协处理器允许用户在RegionServer上运行自己的逻辑代码, 数据的处理流程在服务器上完成,只返回一个很小的结果集, 类似一个小的MapReduce框架。2.协处理器优先级:系统级和用户级 同时序号越小,优先级越高。3.协处理器开始和结束中间保持的是 CoprocessorEnvironment4.如何加载协处理器hbase-site.xml...原创 2019-01-12 17:25:34 · 553 阅读 · 0 评论 -
HBase-行键设计
1.用户可以指定行键检索一行数据,可有效减少查询时间。2.设定列族可减少查询的存储文件。3.存储文件(store file)中每个单元格都保存了时间戳, 所以用户如果查询近一两个小时修改过的单元格, HBase会跳过例如只包含4小时前数据的存储文件。4.列限定符(column qualifier)查询,查询时指定特定的咧或定义过滤器包含或排除某个列。 由于系统需检查每个传到...原创 2019-01-11 15:20:14 · 1879 阅读 · 0 评论 -
HBase-存储原理
1.磁盘上一个列族下所有的单元格都存在一个存储文件(store file)中2.HBase不存储无值的单元格3.存每个单元格时,会把其行键和列键一起存储;4.同一个单元格的多个版本被单独存为连续的单元格,还存储时间戳(版本), 并按时间戳降序排序,因此先读到的是最新版本5.含有结构信息的整个单元格在HBase中叫 KeyValue 。6.KeyValue存储是先按行键排序,有...原创 2019-01-11 10:49:38 · 199 阅读 · 0 评论 -
HBase-查找Region
1.架构图:2.为何要查找Region? 为了让客户端找到包含特定主键的region3.如何查找: 通过两张特殊目录表:-ROOT-和.META.4.查找原理: 1.HBase设计只有一个Root Region,从不拆分,保证类似B+树的三层查找结构。 2.第一层:Zookeeper中包含root region 位置信息的节点。 第二层:从-ROOT-表中查找对应meta...原创 2019-01-10 15:10:37 · 1193 阅读 · 0 评论 -
HBase-Scan扫描
1 . get()方法底层也是Scan实现2 .Scan:类似数据库系统中的游标3.为什么要用Scan:1.HBase中的存储文件是不可变的,因此不能直接删除。因此有墓碑标记,记录着已删除的信息2.也不能直接更新,隔了一段时间新写入的数据会刷写到不同的存储文件中3.那么如何得到“真正准确的一行”?4.HBase没有实现直接访问特定一行或列的功能。5.HFile中最小的单元是块,所以S...原创 2019-01-10 14:33:34 · 855 阅读 · 0 评论 -
大数据技术图谱
转自:https://blog.csdn.net/stpeace/article/details/79232656转载 2018-11-20 10:50:47 · 644 阅读 · 0 评论 -
HBase、Redis、MongoDB、Couchbase、LevelDB
转自:https://www.cnblogs.com/ibook360/p/5674541.html转载 2018-11-20 09:53:13 · 287 阅读 · 0 评论 -
Hadoop组件的各个进程及其作用
转自:https://www.jianshu.com/p/37b04eeedc6d转载 2018-11-06 16:46:49 · 1623 阅读 · 0 评论 -
大数据-面经附个人理解(HBase、MongoDB、Redis)(2)
HBase 0.定义: HBase存储容量大,一个表可以容纳上亿行、上百万列,可应对超大数据量要求 扩展简单的需求。 Hadoop的无缝集成,让HBase的数据可靠性和海量数据分析 性能(MapReduce)值得期待。 1.用途 1.特别适用于简单数据写入(如“消息类”应用)和海量、结构简单数据的查询 (如“详单类”应用)。特别地,适合稀疏...原创 2019-03-01 20:54:59 · 650 阅读 · 4 评论