hbase
浅汐王
这个作者很懒,什么都没留下…
展开
-
hbase rest api的使用
1.打开hbase的官网:http://hbase.apache.org/2.找到rest api的使用指南后,执行以下命令启动REST Server: bin/hbase rest start -p4444 #端口自己指定即可关闭REST Server的命令: bin/hbase rest stop -p4444启动成功以后使用jps命令查看进程:会发现出现RES原创 2017-10-29 16:48:34 · 79557 阅读 · 4 评论 -
Java API HbaseUtil工具类
1、maven pom坐标引入jar<repositories> <!--cloudera仓库地址--> <repository> <id>cloudera</id> <url>https://repository.cloudera.com/ar...原创 2018-10-11 20:34:58 · 554 阅读 · 0 评论 -
搭建hbase伪分布
1.下载http://archive.cloudera.com/cdh5/cdh/5/hbase-1.2.0-cdh5.7.5.tar.gz2.解压tar -zxvf hbase-1.2.0-cdh5.7.5.tar.gz3.修改$HBASE_HOME/conf/hbase-env.shexport JAVA_HOME=/opt/soft/jdk1.8.0_40expo原创 2017-10-26 08:53:45 · 419 阅读 · 0 评论 -
记录一次phoenix启动报错
安装Phoenix时./sqlline.py执行报错File "./sqlline.py", line 27, in import argparse ImportError: No module named argparse解决办法解决办法:# yum install python-argparse然后,再重启HBase集群。bin/sql原创 2017-11-10 08:33:00 · 2480 阅读 · 0 评论 -
hbase各个组件的作用以及hbase的读写流程
原创 2017-10-30 11:28:18 · 1211 阅读 · 0 评论 -
hbase和RDBMS的区别
一 Hbase是个什么东西? 首先我们来看看两个概念,面向行存储和面向列存储。面向行存储,我相信大伙儿应该都清楚,我们熟悉的RDBMS就是此种类型的,面向行存储的数据库主要适合于事务性要求严格场合,或者说面向行存储的存储系统适合OLTP,但是根据CAP理论,传统的RDBMS,为了实现强一致性,通过严格的ACID事务来进行同步,这就造成了系统的可用性和伸缩性方面大大折扣,而目前的很多NoSQL产原创 2017-10-30 08:56:23 · 1463 阅读 · 0 评论 -
Region拆分策略
Region 概念Region是表获取和分布的基本元素,由每个列族的一个Store组成。对象层级图如下: Table (HBase table) Region (Regions for thetable) Store (Store perColumnFamily for each Region for the table原创 2017-10-30 08:52:07 · 1313 阅读 · 0 评论 -
Hbase的架构和实现原理
一、架构思路 Hbase是基于Hadoop的项目,所以一般情况下我们使用的直接就是HDFS文件系统,这里我们不深谈HDFS如何构造其分布式的文件系统,只需要知道虽然Hbase中有多个RegionServer的概念,并不意味着数据是持久化在RegionServer上的,事实上,RegionServer是调度者,管理Regions,但是数据是持久化在HDFS上的。明确这一点,在后面的讨论中,我原创 2017-10-30 08:48:05 · 262 阅读 · 0 评论 -
解决hbase自带的zookeeper启动报错
执行hbase zkcli后报错信息如下:15/10/02 15:17:55 INFO zookeeper.ZooKeeper: Client environment:java.library.path=/opt/cloudera/parcels/CDH-5.4.5-1.cdh5.4.5.p0.7/lib/hadoop/lib/native15/10/02 15:17:55 INFO zo原创 2017-10-30 08:25:29 · 8895 阅读 · 0 评论 -
hbase生存期TTL的设置
TTL简述TTL缩写Time To Live,即生存期。TTL设置了一个基于时间戳的临界值, 内部的管理会自动检查TTL值是否达到上限,在major合并过程中时间戳被判定为超过TTL的数据会被自动删除。TTL参数的单位是秒,默认值是Integer.MAX_VALUE,即2^31-1=2 147 483 647 秒,大约68年。使用TTL默认值的数据可以理解为永久保存。设置TTL1、查看...原创 2018-10-11 20:37:45 · 2759 阅读 · 0 评论