HBase
文章平均质量分 78
AlferWei
一个奋斗在编程路上的程序员。
展开
-
HBase源码系列(二)Client如何找到正确的Region Server
Client 定位 RegionServer流程图Client定位Region Server过程Client 定位 RegionServer流程图Client定位Region Server过程这里我们首先要讲hbase的两张元数据表-ROOT-和.META.表,它们一个保存着region的分部信息,一个保存着region的详细信息。在《hbase实战》这本书里面详细写了查找过程总共有8步:原创 2017-11-07 17:15:56 · 741 阅读 · 0 评论 -
Java/Scala 访问启用kerberos验证的Hadoop集群
通过keytab的方式访问HDFSConfiguration config = new Configuration(); FileSystem hdfs = null; try { if (isKerberosEnable){ System.setProperty("java.security.krb5.con...原创 2018-07-06 11:51:20 · 2747 阅读 · 0 评论 -
hbase表映射到hive
# 创建hbase表hbase(main):087:0* create "test_hbase_mapping_hive", "f"0 row(s) in 1.2400 seconds=> Hbase::Table - test_hbase_mapping_hive# put的数据put "test_hbase_mapping_hive", "001","f:id","...原创 2018-07-17 21:05:45 · 2414 阅读 · 7 评论 -
Spark读取HBase数据源
读取HDFS相关的数据源时,大量使用mapreduce封装的读取数据源的方式,而一个mapreduce job会依赖InputFormat对读取的数据进行格式校验、输入切分等操作。读取HBase数据源,则使用了TableInputFormat。先来看看InputFormat。InputFormatInputFormat是mapreduce提供的数据源格式接口,也就是说,通过该接口可以支持读取各种各...原创 2018-05-03 22:05:17 · 2862 阅读 · 2 评论 -
HBase 配置与设计规则
HBase 入门容易,但如果想要把 HBase 用好,需要紧密结合实际业务,根据不同的业务设计 HBase 表结构和存储策略。下面是在学习和工作中的几点总结,拿出来分享。 配置案例:如果没有很重的读负载,每台机器给HBase最大使用6T的磁盘空间;Java Heap 设置为32G,每个region 20G,每个memstores 128M,其他默认配置。 列族数量 ...原创 2016-12-21 17:11:52 · 687 阅读 · 0 评论 -
HBase源码系列(七)WAL与日志恢复
HLog日志恢复HLog日志恢复原创 2017-11-16 21:52:52 · 1464 阅读 · 1 评论 -
HBase源码系列(五)Get、Scan在服务端是如何处理的?
get 和 scan实际上在服务端的处理,有许多相似的地方,有趣的是get其实也是scan。原创 2017-11-16 20:48:20 · 860 阅读 · 0 评论 -
HBase源码系列(一)客户端入口HTable
HTablePut操作获取RegionLocationsGetDeleteScanHTableHTable作为客户端操作HBase数据的入口,是我们最常见的一个类。当向HBase 写入数据时, 都发生了写什么呢?Put操作获取RegionLocationsHTable中 public void put(final List<Put> puts) throws IOException {原创 2017-11-07 17:06:54 · 3522 阅读 · 0 评论 -
HBase源码系列(四)Put、Delete在服务端是如何处理的?
前面看过了客户端入口HTable中Put、Delete的操作,然后向服务端发送rpc请求,服务端就开始干活了。 还记得Put操作在服务端的入口吗? 服务端RSRpcServicespublic MultiResponse multi(final RpcController rpcc, final MultiRequest request) throws ServiceException {}原创 2017-11-16 18:01:01 · 697 阅读 · 0 评论 -
HBase源码系列(三)HMaster启动过程
这是HBase server端开始的第一章。在HMaster的构造函数,从方法注释上看到,主要做了两件事情: 1、初始化本地的HRegionServer; 2、启动ActiveMasterManager;public HMaster(final Configuration conf, CoordinatedStateManager csm) throws IOException,原创 2017-11-15 15:54:17 · 1119 阅读 · 0 评论 -
HBase源码系列(六)HBase存储结构与StoreFile存储格式
RegionStoreMemStoreMemStore FlushStoreFile HFileHFile 格式KeyValueBlocks这次终于到了HBase的存储部分,先看一下 HBase系统架构图 RegionRegion是构成分布式table的基本元素,它由每个Column Family 对应一个Store组成。/hbase /<Table>原创 2017-11-16 21:50:57 · 3345 阅读 · 0 评论 -
HFile校验
HBase 表大小统计:hbase org.apache.hadoop.hbase.mapreduce.RowCounter test:standardHFile校验:#]hbase hfileusage: HFile [-a] [-b] [-e] [-f <arg> | -r <arg>] [-h] [-k] [-m] [-p] [-s]...原创 2019-03-25 17:38:43 · 791 阅读 · 0 评论