Day10——HBase

最新推荐文章于 2024-10-06 21:49:48 发布

Mortal୧⍤⃝

最新推荐文章于 2024-10-06 21:49:48 发布

阅读量591

点赞数 14

文章标签： hbase 数据库大数据

本文链接：https://blog.csdn.net/2303_77130695/article/details/139747022

版权

文章目录

前言
一、HBase部署与启动
二、HBase基本操作

前言

HBase 是一个面向列式存储的分布式数据库，HBase 底层存储基于 HDFS 实现，集群的管理基于 ZooKeeper 实现。

一、HBase部署与启动

1.下载、解压缩安装包

2.在/etc/profile全局配置文件中添加

export HBASE_HOME=/export/servers/hbase-2.4.5
export PATH=$PATH:$HBASE_HOME/bin

HBASE_HOME按照自己路径配置

3.配置hbase-env.sh

export JAVA_HOME=/export/servers/jdk1.8.0_161
export HBASE_MANAGES_ZK=false  # 使用外部的ZooKeeper

4.配置hbase-site.xml

<configuration>
  <!-- hbase数据存放的目录，若用本地目录，必须带上file://,否则hbase启动不起来 -->
        <property>
                <name>hbase.rootdir</name>
                <value>hdfs://my2308-host:9000/hbase</value>
        </property>

        <!-- zk的位置 -->
        <property>
                <name>hbase.zookeeper.quorum</name>
                <value>localhost</value>
                <description>my2308-host:2181</description>
        </property>

<!--hbase.cluster.distributed表示是否分布式部署,指定为true-->
        <property>
                <name>hbase.cluster.distributed</name>
                <value>true</value>
        </property>

        <!-- hbase主节点的位置 -->
        <property>
                <name>hbase.master</name>
                <value>my2308-host:60000</value>
        </property>
</configuration>

5.拷贝zookeeper的conf/zoo.cfg到hbase的conf/下

6.启动HBase

应先启动Hadoop集群和ZooKeeper服务
在HBase的bin目录下：

start-hbase.sh

二、HBase基本操作

1.数据库操作演示：

进入 hbase 客户端

hbase shell

查看所有库（命名空间）

list_namespace

创建一个名称为’mydb’的库

create_namespace 'mydb'

删除’mydb’库

drop_namespace 'mydb'

2.表操作演示

查看 'mydb’库下的表

list_namespace_tables 'mydb'

查看所有自己创建的表

list

在’mydb’库下创建名为test的表，并创建’f1’、'f2’两个列族

create 'mydb:test','f1','f2'

注意：创建表时若不指定库名，则默认在default库下创建表，创建表需要至少指定一个列族

查看表详细信息

describe 'mydb:test'
或
desc 'mydb:test'

增加列族

alter 'mydb:test','f3'

删除列族

alter 'mydb:test','delete'=>'f2'

删除表

disable 'mydb:test'
drop 'mydb:test'

注意：删除表需要先进行disable，再进行drop

3.数据的CRUD操作

先在 default 库下创建一个名为stu的表，列族名称是 info

create 'stu','info'

插入数据

put 'stu','1001','info:name','linghc'
put 'stu','1001','info:sex','man'
put 'stu','1001','info:age','26'

put 'stu','1002','info:name','renyy'
put 'stu','1002','info:sex','female'
put 'stu','1002','info:age','24'

put 'stu','1003','info:name','yilin'
put 'stu','1003','info:sex','female'
put 'stu','1003','info:age','18'

# 某一行的列的个数可以不一样
put 'stu','1004','info:name','dongfangb'
put 'stu','1004','info:sex','female'
put 'stu','1004','info:age','28'
put 'stu','1004','info:party','rysj'

根据row key（行键）查询

get 'stu','1004'

根据行键、列名查询

get 'stu','1004','info:name','info:age'

扫描表数据

scan 'stu'

按rowkey范围扫描 {STARTROW => ‘1001’ ,STOPROW => ‘1003’} ：左闭右开，此时只查询到 1002

scan 'stu',{STARTROW => '1001' ,STOPROW => '1003'}

指定STOPROW 后加！,可以实现左闭右闭

scan 'stu',{STARTROW => '1001' ,STOPROW => '1003!'}

修改数据：直接put进行覆盖

put 'stu','1001','info:name','linghc1'

注意：修改数据后，其实只是在原来的基础上增加了一条数据，查询的时候返回了时间戳最新的一个版本，旧版本的数据还在；

查寻每个单元格的2个版本数据

scan 'stu',{RAW=>true,VERSIONS=>2}

注意RAW参数必须和VERSIONS一起使用

旧版本的数据在适当的时候会被释放；如果想要保留最新两个版本的数据，可以将某个表的 VERSIONS设置为2。

更改表的VERSIONS

alter 'stu',{NAME=>'info',VERSIONS=>2}

删除数据

delete 'stu','1001','info:sex'

此时查询会发现无数据

get 'stu','1001','info:sex'

再通过版本号查询

scan 'stu',{RAW=>true,VERSIONS=>2}

会发现删除的数据有Delete标注

根据行键和列名删除列

deleteall 'stu','1001','info:sex'

标注为：DeleteColumn

根据行键删除列族

deleteall  'stu','1004'

标注为：DeleteFamily

删除表中所有数据

truncate 'stu'

truncate命令将删除表中的所有数据行，但是保留表的结构和配置信息。

Mortal୧⍤⃝

关注

14
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫