![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
HBase
大曲·蜗牛
努力成为一个大数据的大佬
展开
-
hbase 单机部署
前述:由于自己搜索了网上的所有单机部署,没有一个是可靠,于是研究了下,成功了自己记录方便以后使用. 版本是hbase-2.0.5-bin.tar.gz hbase-env.sh export JAVA_HOME=/opt/soft/jdk1.8.0_141 export HBASE_MANAGES_ZK=false hbase-site.xml <configuration> <property> <name>hbase.rootdir</.原创 2021-12-15 13:57:12 · 1571 阅读 · 0 评论 -
安装 HBASE 2.4.4
一.启动zookeeper服务 /opt/soft/zookeeper-3.4.6/bin/zkServer.sh start /opt/soft/zookeeper-3.4.6/bin/zkServer.sh status /opt/soft/zookeeper-3.4.6/bin/zkServer.sh stop 二.启动hdfs和yarn sbin/start-dfs.sh sbin/start-yarn.sh 三.安装HBASE 3.配置文件 3.1hbas...原创 2021-05-25 15:44:46 · 591 阅读 · 0 评论 -
Hbase 基础理论
是一种分布式,可扩展,支持海量数据存储的NOSQL的数据库 y数据模型 看上去hbase的数据模型和关系的数据库很像的,数据存储只有一张表,有行有列,但是hbase的底层是key-value 这样看hbase 更像一个多维的地图. ...原创 2021-06-09 17:01:41 · 177 阅读 · 0 评论 -
Hbase rowkey 设计
第一种: rowkey长度原则 rowkey是一个二进制码流,可以是任意字符串,最大长度64kb,实际应用中一般为10-100bytes,以byte[]形式保存,一般设计成定长。 建议越短越好,不要超过16个字节, 第二种: rowkey散列原则 假如rowkey按照时间戳的方式递增,不要将时间放在二进制码的前面,建议将rowkey的高位作为散列字段,由程序随机生成,低位放时间字段,这样将提高数据均衡分布在每个RegionServer,以实现负载均衡的几率。如果没有散列字段,首字段直接是时间信息,所原创 2021-06-10 11:27:22 · 102 阅读 · 0 评论 -
hbase 常用的api
1.创建表 public class createTable { @Test public void createTableUntil() throws IOException { //配置连接hbase的参数 Configuration configuration = HBaseConfiguration.create(); configuration.set("hbase.zookeeper.property.clientPort",原创 2021-06-10 16:44:25 · 245 阅读 · 0 评论 -
hbase 预分区
预分区的目的:增加数据读写效率 负载均衡,防止数据倾斜 方便集群容灾调度 region 优化Map数量 预分区的想法: 每一个region维护着startRow与endRowKey,如果加入的数据符合某个region维护的rowKey范围,则该数据交给这个region维护 ...原创 2021-06-10 11:09:32 · 567 阅读 · 0 评论