hbase 预分区

最新推荐文章于 2023-09-06 09:21:02 发布

大曲·蜗牛

最新推荐文章于 2023-09-06 09:21:02 发布

阅读量572

点赞数

分类专栏： HBase 文章标签： hbase

本文链接：https://blog.csdn.net/daqu1314/article/details/117772214

版权

HBase 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

预分区的目的:增加数据读写效率负载均衡,防止数据倾斜方便集群容灾调度 region 优化Map数量

预分区的想法: 每一个region维护着startRow与endRowKey，如果加入的数据符合某个region维护的rowKey范围，则该数据交给这个region维护

第一种手动分区

create 'user6','info','partition',SPLITS => ['1000','2000','3000','4000']

查看效果:

第二种十六进制进行分区

create 'user7','info','partition',{NUMREGIONS => 15, SPLITALGO => 'HexStringSplit'}

第三种文件内容分区

create 'user8','partition',SPLITS_FILE => '/opt/a.txt'

文件内容:

aaaaaa

bbbbb

cccccc

效果图:

第四种 java api 分区

public class hbaseSplit {

     public  void hbaseSplitFunc() throws IOException {

          Configuration configuration = HBaseConfiguration.create();
          configuration.set("hbase.zookeeper.quorum","node01:2181,node02:2181,node03:2181");
          Connection connection = ConnectionFactory.createConnection(configuration);
          Admin admin = connection.getAdmin();


          byte[][] splitKeys = {{5,4,3,2,1},{'a','b','c','d','e'}};

          HTableDescriptor descriptor = new HTableDescriptor(TableName.valueOf("user9"));

          descriptor.addFamily(new HColumnDescriptor("info"));
          descriptor.addFamily(new HColumnDescriptor("info2"));

          admin.createTable(descriptor,splitKeys);

     }

}

大曲·蜗牛

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
hbase 预分区

预分区的目的:增加数据读写效率负载均衡,防止数据倾斜方便集群容灾调度 region 优化Map数量预分区的想法: 每一个region维护着startRow与endRowKey，如果加入的数据符合某个region维护的rowKey范围，则该数据交给这个region维护...
复制链接

扫一扫

专栏目录