Hbase面试题

最新推荐文章于 2024-05-15 14:41:06 发布

summer2381

最新推荐文章于 2024-05-15 14:41:06 发布

阅读量230

点赞数

分类专栏： Hbase面试题

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Summer2381/article/details/101040470

版权

Hbase面试题专栏收录该内容

1 篇文章 0 订阅

订阅专栏

HBase面试问题

一、HBase的特点是什么

1.HBase一个分布式的基于列式存储的数据库,基于hadoop的hdfs存储，zookeeper进行管理。

2.HBase适合存储半结构化或非结构化数据，对于数据结构字段不够确定或者杂乱无章很难按一个概念去抽取的数据。

3.HBase为null的记录不会被存储.

4.基于的表包含rowkey，时间戳，和列族。新写入数据时，时间戳更新，同时可以查询到以前的版本.

5.HBase是主从架构。Hmaster作为主节点，Hregionserver作为从节点。

二、HBase和hive的区别

注：(参考HIVE和hbase区别)

三、描述HBase的rowkey的设计原则

注：(描述HBase的rowkey的设计原则 )

四、描述HBase中scan和get的功能以及实现的异同

HBase的查询实现只提供两种方式：

1、按指定RowKey 获取唯一一条记录，get方法（org.apache.hadoop.hbase.client.Get）

Get 的方法处理分两种 : 设置了ClosestRowBefore 和没有设置的rowlock .主要是用来保证行的事务性，即每个get 是以一个row 来标记的.一个row中可以有很多family 和column.

2、按指定的条件获取一批记录，scan方法(org.apache.Hadoop.hbase.client.Scan）实现条件查询功能使用的就是scan 方式.

1)scan 可以通过setCaching 与setBatch 方法提高速度(以空间换时间)；

2)scan 可以通过setStartRow 与setEndRow 来限定范围([start，end)start 是闭区间，

end 是开区间)。范围越小，性能越高。

3)、scan 可以通过setFilter 方法添加过滤器，这也是分页、多条件查询的基础。

五、描述如何解决HBase中region太小和region太大带来的冲突

Region过大会发生多次compaction，将数据读一遍并重写一遍到hdfs 上，占用io，region过小会造成多次split，region 会下线，影响访问服务，调整hbase.hregion.max.filesize 为256m.

六、简述HBase中compact用途是什么，什么时候触发，分为哪两种,有什么区别，有哪些相关配置参数？

在hbase中每当有memstore数据flush到磁盘之后，就形成一个storefile，当storeFile的数量达到一定程度后，就需要将 storefile 文件来进行 compaction 操作。

Compact 的作用：

1>.合并文件

2>.清除过期，多余版本的数据

3>.提高读写数据的效率

HBase 中实现了两种 compaction 的方式：minor and major. 这两种 compaction 方式的区别是：

1、Minor 操作只用来做部分文件的合并操作以及包括 minVersion=0 并且设置 ttl 的过

期版本清理，不做任何删除数据、多版本数据的清理工作。

2、Major 操作是对 Region 下的HStore下的所有StoreFile执行合并操作，最终的结果是整理合并出一个文件。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hbase面试题

HBase面试问题一、HBase的特点是什么1.HBase一个分布式的基于列式存储的数据库,基于hadoop的hdfs存储，zookeeper进行管理。2.HBase适合存储半结构化或非结构化数据，对于数据结构字段不够确定或者杂乱无章很难按一个概念去抽取的数据。3.HBase为null的记录不会被存储.4.基于的表包含rowkey，时间戳，和列族。新写入数据时，时间戳更新，同时...
复制链接

扫一扫

专栏目录

summer2381 CSDN认证博客专家 CSDN认证企业博客

码龄6年

38: 原创

11万+: 周排名

214万+: 总排名

2万+: 访问

: 等级

564: 积分

7: 粉丝

5: 获赞

0: 评论

15: 收藏

私信

关注

热门文章

分类专栏

spark面试题 1篇
Hbase面试题 1篇
Hadoop 4篇
spark
JVM 1篇
Java框架 1篇
Redis
Hbase 3篇
Kafka
面试题
sqoop 1篇
AQS 1篇
java多线程
爬虫 1篇
java 4篇
机器学习 3篇
linux 1篇
前端 1篇
AdaBoosting 1篇
hive 6篇
数据库 2篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。