目录
0 引言
0.1 数据库与数据仓库
0.2 数据仓库的主要特征
0.3 数据仓库的分层架构
0.4 数据仓库元数据管理
1 Apach Hive
1.1 Hive 简介
1.2 pass
2 HBase shell 基本指令
2.1 进入console
hbase shell
compact分为两类,一类叫Minor compact ,一类叫Major compact,Minor compact只是进行文件merge操作,而Major compact除了做文件Merge操作,还会将其中的delete项删除。
major_compact 'test'
2.2 表相关操作
- 创建表
create 'xhh_t1', {NAME=>'attr'}
- 显示表
list
TABLE
xhh_t1
1 row(s) in 0.0090 seconds
- 查看表信息
desc 'xhh_t1'
COLUMN FAMILIES DESCRIPTION
{NAME => 'attr', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER', COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLO
CKSIZE => '65536', REPLICATION_SCOPE => '0'}
1 row(s) in 0.0180 seconds
- 修改表结构
# hbase attr的生存期TTL设置为1天(86400秒)
disable 'xhh_t1'
alter "xhh_t1",NAME=>'attr',TTL=>'86400'
- 删除表
先disable,然后drop
disable 'xhh_t1'
drop 'xhh_t1'
2.3 增删改查
- 增加(修改)数据
put 'xhh_t1', 'row_key1','attr:column_name', '2021-7-21 14:49:49->X001'
put 'xhh_t1', 'row_key2','attr:column_name', '2021-7-21 14:49:49->X022'
- 查询一行数据
get 'xhh_t1', 'row_key1'
COLUMN CELL
attr:column_name timestamp=1626850487448, value=2021-7-21 14:49:49->X001
1 row(s) in 0.0090 seconds
- 查询多行数据
# scan 'xhh_t1',{LIMIT=>2} # 查询两条
scan 'xhh_t1'
ROW COLUMN+CELL
row_key column=attr:column_name, timestamp=1626850353193, value=2021-7-21 14:49:49->X00
2
row_key1 column=attr:column_name, timestamp=1626850487448, value=2021-7-21 14:49:49->X00
1
row_key2 column=attr:column_name, timestamp=1626850502734, value=2021-7-21 14:49:49->X02
2
3 row(s) in 0.0150 seconds
- 删除一行数据
deleteall 'xhh_t1','row_key'
- 删除所有数据
# 过程:disable table -> drop table -> create table
truncate 'xhh_t1'