hbase面试题

标签: hbase
6人阅读 评论(0) 收藏 举报
分类:

一、HBase的特点是什么
1.HBase一个分布式的基于列式存储的数据库,基于hadoop的hdfs存储,zookeeper进行管理。
2.HBase适合存储半结构化或非结构化数据,对于数据结构字段不够确定或者杂乱无章很难按一个概念去抽取的数据。
3.HBase为null的记录不会被存储.
4.基于的表包含rowkey,时间戳,和列族。新写入数据时,时间戳更新,同时可以查询到以前的版本.
5.HBase是主从架构。Hmaster作为主节点,Hregionserver作为从节点。

二、HBase和hive的区别
注:(参考HIVE和hbase区别)

三、描述HBase的rowkey的设计原则
注:(描述HBase的rowkey的设计原则 )

四、描述HBase中scan和get的功能以及实现的异同
HBase的查询实现只提供两种方式:
1、按指定RowKey 获取唯一一条记录,get方法(org.apache.hadoop.hbase.client.Get)

Get 的方法处理分两种 : 设置了ClosestRowBefore 和没有设置的rowlock .主要是用来保证行的事务性,即每个get 是以一个row 来标记的.一个row中可以有很多family 和column.

2、按指定的条件获取一批记录,scan方法(org.apache.Hadoop.hbase.client.Scan)实现条件查询功能使用的就是scan 方式.

1)scan 可以通过setCaching 与setBatch 方法提高速度(以空间换时间);

2)scan 可以通过setStartRow 与setEndRow 来限定范围([start,end)start 是闭区间,

end 是开区间)。范围越小,性能越高。

3)、scan 可以通过setFilter 方法添加过滤器,这也是分页、多条件查询的基础。

五、描述如何解决HBase中region太小和region太大带来的冲突
Region过大会发生多次compaction,将数据读一遍并重写一遍到hdfs 上,占用io,region过小会造成多次split,region 会下线,影响访问服务,调整hbase.hregion.max.filesize 为256m.

六、简述HBase中compact用途是什么,什么时候触发,分为哪两种,有什么区别,有哪些相关配置参数?
在hbase中每当有memstore数据flush到磁盘之后,就形成一个storefile,当storeFile的数量达到一定程度后,就需要将 storefile 文件来进行 compaction 操作。
Compact 的作用:

1>.合并文件

2>.清除过期,多余版本的数据

3>.提高读写数据的效率

HBase 中实现了两种 compaction 的方式:minor and major. 这两种 compaction 方式的区别是:

1、Minor 操作只用来做部分文件的合并操作以及包括 minVersion=0 并且设置 ttl 的过

期版本清理,不做任何删除数据、多版本数据的清理工作。

2、Major 操作是对 Region 下的HStore下的所有StoreFile执行合并操作,最终的结果是整理合并出一个文件。

查看评论

常见Hadoop面试题

  • 2018年01月21日 16:44
  • 44KB
  • 下载

大数据Hbase 面试题

1.2 hbase 的特点是什么    (1) Hbase一个分布式的基于列式存储的数据库,基于Hadoop的hdfs存储,zookeeper进行管理。 (2) Hbase适合存储半结构化或非...
  • haohaixingyun
  • haohaixingyun
  • 2016-10-14 22:33:09
  • 9247

hbase面试题汇总(8)

先收藏,后面一点点汇总添加 1、一个Hadoop环境,整合了Hbase和Hive,是否有必要给HDFS和Hbase都分别配置压缩策略?请给出对压缩策略的建议。 2、Hadoop和Hbase等组件...
  • qiezikuaichuan
  • qiezikuaichuan
  • 2016-06-20 10:17:20
  • 2669

HBase基础的几个关键点--大概可能是面试题(7)

HBase基础的几个关键点--大概可能是面试题 1.      Region的rowkey范围是开区间还是闭区间?描述一下 2.      Scan的rowkey范围是开区间还是闭区间?描述...
  • qiezikuaichuan
  • qiezikuaichuan
  • 2016-06-20 10:13:02
  • 825

Hbase总结之hbase37个笔试题

以下试题是摘自互联网的基础上自己加了选项说明解释便于自己以后看时方便节省时间 1. HBase来源于哪篇博文? C A The Google File System B ...
  • ljp812184246
  • ljp812184246
  • 2016-09-13 16:39:58
  • 516

hbase面试题(6)

1. HBase来源于哪篇博文? C A The Google File System B MapReduce C BigTable D Chubby 2. 下...
  • qiezikuaichuan
  • qiezikuaichuan
  • 2016-06-20 10:12:23
  • 1233

Hbase面试题

一、HBase的特点是什么1.HBase一个分布式的基于列式存储的数据库,基于hadoop的hdfs存储,zookeeper进行管理。2.HBase适合存储半结构化或非结构化数据,对于数据结构字段不够...
  • BlackArmand
  • BlackArmand
  • 2018-03-06 17:45:37
  • 55

Hbase相关面试题

他人真实面试问题 HBase的架构和基本原理 HBase与传统关系型数据库如MySQL的区别 读写性能对比读快还是写快 Hbase的设计有什么心得 Hbase的操作是用的什么API还是什么工具 你们h...
  • HaixWang
  • HaixWang
  • 2018-03-11 11:44:33
  • 320

HBase 笔试题

以下试题是摘自互联网的基础上自己加了选项说明解释便于自己以后看时方便节省时间 HBase来源于哪篇博文? C A The Google File System B MapReduce C Big...
  • andrewgb
  • andrewgb
  • 2016-01-10 19:43:30
  • 1133

Hbase总结(六)hbase37个笔试题

以下试题是摘自互联网的基础上自己加了选项说明解释便于自己以后看时方便节省时间 1. HBase来源于哪篇博文? C A The Google File System B MapReduce...
  • lifuxiangcaohui
  • lifuxiangcaohui
  • 2014-10-10 15:05:55
  • 17768
    个人资料
    等级:
    访问量: 366
    积分: 252
    排名: 30万+
    文章存档