HBase
文章平均质量分 65
芦苇_
人是有思想的芦苇 最近忙于将这几年的有道云笔记搬过来
展开
-
HBase Region split 策略
本文是基于hbase-0.98.6-cdh5.2.0的Region split policyHBase的region split策略。原创 2015-08-03 19:53:24 · 3313 阅读 · 0 评论 -
Region Splitting 过程
HBase中region的split过程翻译 2015-08-10 13:54:26 · 1131 阅读 · 0 评论 -
HBase数据压缩方式的选择
HBase压缩数据压缩方式选择翻译 2015-07-23 17:53:59 · 4897 阅读 · 0 评论 -
HBase meta表数据修复
目的为了弄清楚hbase:meta表中的数据(每个表的region所在的regionserver信息)是否会在集群每次重启后重新生成。过程将hbase:meta表中数据全部删除后重启集群,结果发现只有hbase:namespace的信息会重新生成并插入到hbase:meta表中,而其他所有用户表(用户自己创建的表)的信息都没有恢复。这里又牵扯到另一个问题,如何修复hbase:meta表中的数据,用户原创 2015-07-31 08:45:06 · 5691 阅读 · 0 评论 -
HBase创建表参数说明
HBase创建表参数说明原创 2015-07-21 17:45:36 · 9151 阅读 · 0 评论 -
HBase表预分区
HBase 预分区标签(空格分隔): Hadoop HBase在创建HBase表的时候默认一张表只有一个region,所有的put操作都会往这一个region中填充数据,当这个一个region过大时就会进行split。如果在创建HBase的时候就进行预分区则会减少当数据量猛增时由于region split带来的资源消耗。原创 2015-07-21 15:09:05 · 11868 阅读 · 1 评论 -
HBase -ROOT-表和.META.表
官方文档:http://hbase.apache.org/book.html#arch.catalog原创 2015-07-22 15:05:32 · 1629 阅读 · 0 评论 -
HBase客户端查找数据过程
客户端查找HBase表数据过程原创 2015-07-22 14:39:47 · 2110 阅读 · 0 评论 -
配置Snappy压缩
1. 功能说明使用snappy压缩来提升mapreduce和hbase的性能。其实就是用CPU换IO吞吐量和磁盘空间。配置并使用snappy有如下几点要求: 首先需要hadoop集群的native库已经收到编译好,并且添加了对snappy的支持。编译hadoop源码之前安装了snappy并且编译时指定-Drequire.snappy参数。原创 2015-07-23 11:50:39 · 15572 阅读 · 0 评论