Hbase2.0新特性（一）

最新推荐文章于 2024-04-12 11:22:14 发布

Adobee Chen

最新推荐文章于 2024-04-12 11:22:14 发布

阅读量3k

点赞数

分类专栏：大数据

本文链接：https://blog.csdn.net/qq_24186017/article/details/80838119

版权

大数据专栏收录该内容

10 篇文章 1 订阅

订阅专栏

HBASE-20464 | Major | 禁用IMC

①在 CompactingMemStore这个类中默认使用BASIC

public static final String COMPACTING_MEMSTORE_TYPE_DEFAULT =

String.valueOf(MemoryCompactionPolicy.BASIC);

②但是优先级别是 hbase-default.xml

 
   <property> 
 
      <name>hbase.hregion.compacting.memstore.type</name> 
 
      <value>NONE</value> 
 
      <description>Determines the type of memstore to be used by user tables on 
 
        creation. By default it is NONE and so we use the default memstore. To enable 
 
        compacting memstore on creation of new user tables, set this property to 
 
        BASIC/EAGER/ADAPTIVE. All subsequent table creations will have the 
 
        new value of this attribute. 
 
        See http://hbase.apache.org/book.html#inmemory_compaction for more on 
 
        In-memory Compaction. 
 
      </description> 
 
    </property> 
 
  注： 默认不压缩memstore,可以配置成BASIC/EAGER/ADAPTIVE对memstore进行压缩 
 
   <property> 
 
      <name>hbase.systemtables.compacting.memstore.type</name> 
 
      <value>NONE</value> 
 
      <description>Determines the type of memstore to be used for system tables like 
 
        META, namespace tables etc., on creation. By default NONE is the type and hence 
 
        we use the default memstore for all the system tables. If we need to have compacting 
 
        memstore on creation of system tables then set this property to BASIC/EAGER 
 
        See http://hbase.apache.org/book.html#inmemory_compaction for more on 
 
        In-memory Compaction. 
 
      </description> 
 
    </property> 
 
  注：创建系统表的时候，默认是none,可以改成BASIC和EAGER

问题？需要测试CompactingMemstore 和DefaultMemstore在代码中的调用顺序。

HBASE-20276 | 阻止者 | [shell]恢复shell的REPL变更和文件--->待续

HBASE-18792 | 阻止者 | hbase-2需要防御hbck操作 ----改变了shell 命令

HBASE-19994 | Major | 为RPC限制异常创建一个新类，使其可重试。

 
  新的RpcThrottlingException不赞成ThrottlingException。新的RpcThrottlingException是一个可重试的异常，客户端将在超过Rpc限制配额时重试。弃用的ThrottlingException是一个不可修改的异常。 
 

Quota 限额

 
  1.quota的语句 
 
  hbase> set_quota TYPE => THROTTLE, THROTTLE_TYPE => READ, USER => 'u1', TABLE => 't2', LIMIT => '10req/sec' 
 
  2.quota的介绍 
 
  （1）Quotas分别支持表级别以及用户级别资源限制，或者同时支持表级别和用户级别，如示例所示 
 
  （2）THROTTLE_TYPE可以取值READ / WRITE，分别对随机读和随机写进行限制 
 
  （3）LIMIT 可以从两个维度对资源进行限制，分别为req/time 和 size/time，前者限制单位时间内的请求数，后者限制单位时间内的请求数据量。需要指明的是time的单位可以是sec | min | hour | day，size的单位可以是B(bytes) | K | M | G | T | P，因此LIMIT可以表示为’1000req/min’或者’100G/day’，分别表示’限制1分钟的请求数在1000次以内’，’限制一台的数据量为100G’ 
 
   总体来说，Quotas功能总体看来基本完成了资源限制的职能，达到了资源限制的目的。同时 支持用户级别和表级别，另外同时支持请求大小和请求数量两个维度，基本涵盖了常见的资源限制维度

目的：起到资源限制的作用，当客户端超过RPC限制时进行重试，直到成功或者资源耗尽

HBASE-20224 | 阻止者 | Web UI在独立模式下被破坏------->待续
HBASE-18784 | Major | 使用需要hflush / hsync / append / etc的文件系统应查询outputstream功能

 
  ① sync、hflush、hsync的解释 
 
  hadoop2.0及以上版本的DFSOutputStream提供了sync ,hflush,hsync三个方法，三个方法的区别是 
 
  sync: client将数据刷到每个Datanode的缓存中，会有数据丢失的风险 
 
  hflush：与sync一样，会有数据丢失的风险 
 
  hsync：client客户端将数据刷到每个Datanode磁盘中，不会有数据丢失的风险。 
 
  ②在哪里用的hsync和hflush 
 
  2.0.0版本在WALProcedureStore这个类中增加了些同步方法，防止当hadoop集群出现故障时，hbase访问WAL时无法访问之前预写入日志的所有数据，导致数据丢失的问题。 
 
  ③hbase-2.0.0在WALProcedureStore改动的位置 
 
  protected  
  void  
  syncStream( 
  final  
  FSDataOutputStream  
  stream 
  )  
  throws  
  IOException { 
 
  if  
  ( 
  useHsync 
  ) { 
 
  stream 
  .hsync(); 
 
      }  
  else  
  { 
 
  stream 
  .hflush(); 
 
      } 
 
    }

HBASE-20219 | 严重 | 使用reverse = true和loadColumnFamiliesOnDemand = true进行扫描时发生错误

①重现步骤如下：

1.创建一个包含多个列族的表格

 
    CREATE TABLE TBL（ 
   
    COL1 VARCHAR NOT NULL， 
   
    COL2 VARCHAR NOT NULL， 
   
    COL3 VARCHAR， 
   
    FAM.COL4 VARCHAR， 
   
    CONSTRAINT TRADE_EVENT_PK PRIMARY KEY（COL1，COL2） 
   
    ）

2.插入一行

 
    UPSERT INTO TBL（COL1，COL2）值（ 
    'AAA' 
    ， 
    'BBB' 
    ） 
   

3.使用DESC查询表格

 
    SELECT * FROM TBL WHERE COL2 = 
    ' 
    BBB'ORDER BY COL1 DESC 
   

遵循上述步骤，我们会面临以下例外情况。

    java.util.concurrent.ExecutionException：org.apache.phoenix.exception.PhoenixIOException：org.apache.hadoop.hbase.DoNotRetryIOException：TBL ,, 1521251842845.153781990c0fb4bc34e3f2c721a6f415 .: requestSeek无法在ReversedKeyValueHeap上调用 
  
    在org.apache.phoenix.util.ServerUtil.createIOException（ServerUtil.java:96） 
  
    在org.apache.phoenix.util.ServerUtil.throwIOException（ServerUtil.java:62） 
  
    在org.apache.phoenix.iterate.RegionScannerFactory $ 1.nextRaw（RegionScannerFactory.java:212） 
  
    在org.apache.phoenix.coprocessor.DelegateRegionScanner.nextRaw（DelegateRegionScanner.java:82） 
  
    在org.apache.phoenix.coprocessor.DelegateRegionScanner.nextRaw（DelegateRegionScanner.java:82） 
  
    在org.apache.phoenix.coprocessor.BaseScannerRegionObserver $ RegionScannerHolder.nextRaw（BaseScannerRegionObserver.java:294） 
  
    在org.apache.hadoop.hbase.regionserver.RSRpcServices.scan（RSRpcServices.java:2808） 
  
    在org.apache.hadoop.hbase.regionserver.RSRpcServices.scan（RSRpcServices.java:3045） 
  
    在org.apache.hadoop.hbase.protobuf.generated.ClientProtos $ ClientService $ 2.callBlockingMethod（ClientProtos.java:36613） 
  
    在org.apache.hadoop.hbase.ipc.RpcServer.call（RpcServer.java:2352） 
  
    在org.apache.hadoop.hbase.ipc.CallRunner.run（CallRunner.java:124） 
  
    在org.apache.hadoop.hbase.ipc.RpcExecutor $ Handler.run（RpcExecutor.java:297） 
  
    在org.apache.hadoop.hbase.ipc.RpcExecutor $ Handler.run（RpcExecutor.java:277） 
  
    导致：java.lang.IllegalStateException：无法在ReversedKeyValueHeap上调用requestSeek 
  
    在org.apache.hadoop.hbase.regionserver.ReversedKeyValueHeap.requestSeek（ReversedKeyValueHeap.java:65） 
  
    在org.apache.hadoop.hbase.regionserver.HRegion $ RegionScannerImpl.joinedHeapMayHaveData（HRegion.java:6485） 
  
    在org.apache.hadoop.hbase.regionserver.HRegion $ RegionScannerImpl.nextInternal（HRegion.java:6412） 
  
    在org.apache.hadoop.hbase.regionserver.HRegion $ RegionScannerImpl.nextRaw（HRegion.java:6126） 
  
    在org.apache.hadoop.hbase.regionserver.HRegion $ RegionScannerImpl.nextRaw（HRegion.java:6112） 
  
    在org.apache.phoenix.iterate.RegionScannerFactory $ 1.nextRaw（RegionScannerFactory.java:175） 
  
    ... 10多

②以下是我自己测试的，果然报了问题

 
  public  
  static  
  void  
  test()  
  throws  
  IOException { 
 
 
                
  final  
  byte 
  []  
  FAM1  
  =  
  Bytes 
  . 
  toBytes 
  ( 
  "fam1" 
  ); 
 
 
                
  final  
  byte 
  []  
  FAM2  
  =  
  Bytes 
  . 
  toBytes 
  ( 
  "fam2" 
  ); 
 
 
                
  final  
  byte 
  []  
  COL1  
  =  
  Bytes 
  . 
  toBytes 
  ( 
  "col1" 
  ); 
 
 
                
  final  
  byte 
  []  
  COL2  
  =  
  Bytes 
  . 
  toBytes 
  ( 
  "col2" 
  ); 
 
 
                
  final  
  byte 
  []  
  VAL1  
  =  
  Bytes 
  . 
  toBytes 
  ( 
  "val1" 
  ); 
 
 
                
  final  
  byte 
  []  
  VAL2  
  =  
  Bytes 
  . 
  toBytes 
  ( 
  "val2" 
  ); 
 
 
               Table  
  table  
  =  
  connection 
  .getTable(TableName. 
  valueOf 
  ( 
  "C00119" 
  )); 
 
 
               Put  
  put  
  =  
  new  
  Put( 
  Bytes 
  . 
  toBytes 
  ( 
  "row1" 
  )); 
 
 
                
  put 
  .addColumn( 
  FAM1 
  ,  
  COL1 
  ,  
  VAL1 
  ); 
 
 
                
  put 
  .addColumn( 
  FAM2 
  ,  
  COL2 
  ,  
  VAL2 
  ); 
 
 
                
  table 
  .put( 
  put 
  ); 
 
 
                
  put  
  =  
  new  
  Put( 
  Bytes 
  . 
  toBytes 
  ( 
  "row2" 
  )); 
 
 
                
  put 
  .addColumn( 
  FAM2 
  ,  
  COL2 
  ,  
  Bytes 
  . 
  toBytes 
  ( 
  "val" 
  )); 
 
 
                
  table 
  .put( 
  put 
  ); 
 
 
               SingleColumnValueFilter  
  filter  
  =  
  new  
  SingleColumnValueFilter( 
  FAM1 
  ,  
  COL1 
  , CompareOperator. 
  EQUAL 
  ,  
  VAL1 
  );  
  // 判断列值是否等于val1 
 
 
                
  filter 
  .setFilterIfMissing( 
  true 
  ); 
  // 如果为true，当这一列不存在时，不会返回，如果为false，当这一列不存在时，会返回所有的列信息 
 
 
               Scan  
  scan  
  =  
  new  
  Scan(); 
 
 
                
  scan 
  .addFamily( 
  FAM1 
  ); 
 
 
                
  scan 
  .addFamily( 
  FAM2 
  ); 
 
 
                
  scan 
  .setFilter( 
  filter 
  ); 
 
 
                
  scan 
  .setReversed( 
  true 
  ); 
 
 
                
  scan 
  .setLoadColumnFamiliesOnDemand( 
  true 
  ); 
 
 
               ResultScanner  
  scanner  
  =  
  table 
  .getScanner( 
  scan 
  ); 
 
 
                
  for  
  (Result  
  result  
  :  
  scanner 
  ) { 
 
 
                      String  
  row  
  =  
  Bytes 
  . 
  toString 
  ( 
  result 
  .getRow()); 
 
 
                       
  for  
  (Cell  
  cell  
  :  
  result 
  .rawCells()) { 
 
 
                            String  
  family  
  =  
  Bytes 
  . 
  toString 
  (CellUtil. 
  cloneFamily 
  ( 
  cell 
  )); 
 
 
                            String  
  qualifier  
  =  
  Bytes 
  . 
  toString 
  (CellUtil. 
  cloneQualifier 
  ( 
  cell 
  )); 
 
 
                            String  
  value  
  =  
  Bytes 
  . 
  toString 
  (CellUtil. 
  cloneValue 
  ( 
  cell 
  )); 
 
 
                            System. 
  out 
  .println( 
  "rowkey："  
  +  
  row  
  +  
  "列族为："  
  +  
  family  
  +  
  "列名为："  
  +  
  qualifier  
  +  
  "值为："  
  +  
  value 
  ); 
 
 
                      } 
 
 
               } 
 
 
         } 
 

报错：

 
  Exception in thread "main" java.io.UncheckedIOException: org.apache.hadoop.hbase.DoNotRetryIOException: org.apache.hadoop.hbase.DoNotRetryIOException: Reverse scan with loading CFs on demand is not supported 
 
         at org.apache.hadoop.hbase.regionserver.ReversedRegionScannerImpl.initializeKVHeap( 
  ReversedRegionScannerImpl.java:56 
  ) 
 
         at org.apache.hadoop.hbase.regionserver.HRegion$RegionScannerImpl.initializeScanners( 
  HRegion.java:6180 
  ) 
 
         at org.apache.hadoop.hbase.regionserver.HRegion$RegionScannerImpl.<init>( 
  HRegion.java:6151 
  ) 
 
         at org.apache.hadoop.hbase.regionserver.HRegion$RegionScannerImpl.<init>( 
  HRegion.java:6113 
  ) 
 
         at org.apache.hadoop.hbase.regionserver.ReversedRegionScannerImpl.<init>( 
  ReversedRegionScannerImpl.java:48 
  ) 
 
         at org.apache.hadoop.hbase.regionserver.HRegion.instantiateRegionScanner( 
  HRegion.java:2797 
  ) 
 
         at org.apache.hadoop.hbase.regionserver.HRegion.getScanner( 
  HRegion.java:2779 
  ) 
 
         at org.apache.hadoop.hbase.regionserver.HRegion.getScanner( 
  HRegion.java:2761 
  ) 
 
         at org.apache.hadoop.hbase.regionserver.HRegion.getScanner( 
  HRegion.java:2755 
  )

总结：目前hbase-2.0.0 不支持按需加载CFs的反向扫描。

具体到底为什么会不支持，需要下来花时间再看一下。

HBASE-20358 | Minor | Fix bin/hbase thrift usage text --> 清理使用消息和命令行处理（无功能更改）
HBASE-20182 | Blocker | Can not locate region after split and merge

 
  hbase-2.0.0中如果我们定位某个区域时，碰到拆分父级，将跳到下一行进行重试。直到该区域不包含我们的行。(不会报错，RegionOfflineException), 
 
  如果split children还没有online,最后到达不包含这行的区域报IOException 
 
  原因是:在执行串行复制功能时，在分割某个Region时，不会删除parent region，而是将parent region标记为offline 
 
  HBASE-20046重新考虑串行复制的实现

说明：根据hbase官网顺序进行解读，作者微信:15559730752

Adobee Chen

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hbase2.0新特性（一）

HBASE-20464 | Major | 禁用IMC①在CompactingMemStore这个类中默认使用BASIC public static final String COMPACTING_MEMSTORE_TYPE_DEFAULT = String.valueOf(MemoryCompactionPolicy.BASIC);②但是优先级别是 hbase-default.xml...
复制链接

扫一扫

专栏目录