【由浅入深讨论HBase:自认全网最全最细】,你想了解的关于HBase知识,基本上都有

最后

🍅 硬核资料:关注即可领取PPT模板、简历模板、行业经典书籍PDF。
🍅 技术互助:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。
🍅 面试题库:由技术群里的小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。
🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

4 HBase命令行操作
名称命令表达式
创建表create ‘表名’, ‘列族名1’,‘列族名2’,‘列族名N’
查看所有表list
描述表describe ‘表名’
判断表存在exists ‘表名’
判断是否禁用启用表is_enabled ‘表名’ is_disabled ‘表名’
添加记录put ‘表名’, ‘rowKey’, ‘列族 : 列‘ , ‘值’
查看记录rowkey下的所有数据get ‘表名’ , ‘rowKey’
查看表中的记录总数count ‘表名’
获取某个列族get ‘表名’,‘rowkey’,‘列族’
获取某个列族的某个列get ‘表名’,‘rowkey’,'列族:列’
删除记录delete ‘表名’ ,‘行名’ , ‘列族:列’
删除整行deleteall ‘表名’,‘rowkey’
删除一张表先要屏蔽该表,才能对该表进行删除 第一步 disable ‘表名’ ,第二步 drop ‘表名’
清空表truncate ‘表名’
查看所有记录scan “表名”
查看某个表某个列中所有数据scan “表名” , {COLUMNS=>‘列族名:列名’}
更新记录就是重写一遍,进行覆盖,hbase没有修改,都是追加

① help 帮助命令
hbase(main):005:0> help
在这里插入图片描述
查看具体命令的帮助信息
hbase(main):006:0> help ‘create’
在这里插入图片描述
② create 创建表
创建user表,包含info、data两个列族
使用create命令
hbase(main):008:0> create ‘user’, ‘info’, ‘data’
0 row(s) in 1.3080 seconds
或者
=> Hbase::Table - user
hbase(main):009:0> create ‘user’,{NAME => ‘info’, VERSIONS => ‘3’},{NAME => ‘data’}
ERROR: Table already exists: user!
在这里插入图片描述
③ put 插入数据操作
向表中插入数据
使用put命令
向user表中插入信息,row key为rk0001,列族info中添加名为name的列,值为zhangsan
HBase(main):011:0> put ‘user’, ‘rk0001’, ‘info:name’, ‘zhangsan’

向user表中插入信息,row key为rk0001,列族info中添加名为gender的列,值为female
HBase(main):012:0> put ‘user’, ‘rk0001’, ‘info:gender’, ‘female’

向user表中插入信息,row key为rk0001,列族info中添加名为age的列,值为20
HBase(main):013:0> put ‘user’, ‘rk0001’, ‘info:age’, 20

向user表中插入信息,row key为rk0001,列族data中添加名为pic的列,值为picture
HBase(main):014:0> put ‘user’, ‘rk0001’, ‘data:pic’, ‘picture’
在这里插入图片描述
④ 查询数据操作一
查询方式一 使用get命令通过rowkey进行查询
获取user表中row key为rk0001的所有信息(即所有cell的数据)
使用get命令
HBase(main):015:0> get ‘user’, ‘rk0001’
在这里插入图片描述
使用get命令查看rowkey下某个列族的信息
获取user表中row key为rk0001,info列族的所有信息
HBase(main):016:0> get ‘user’, ‘rk0001’, ‘info’
在这里插入图片描述
使用get命令查看rowkey指定列族指定字段的值
获取user表中row key为rk0001,info列族的name、age列的信息
HBase(main):017:0> get ‘user’, ‘rk0001’, ‘info:name’, ‘info:age’
在这里插入图片描述
在这里插入图片描述
使用get命令查看rowkey指定多个列族的信息
获取user表中row key为rk0001,info、data列族的信息
HBase(main):018:0> get ‘user’, ‘rk0001’, ‘info’, ‘data’

或者你也可以这样写
HBase(main):019:0> get ‘user’, ‘rk0001’, {COLUMN => [‘info’, ‘data’]}

或者你也可以这样写,也行
HBase(main):020:0> get ‘user’, ‘rk0001’, {COLUMN => [‘info:name’, ‘data:pic’]}
在这里插入图片描述
使用get命令指定rowkey与列值过滤器查询
获取user表中row key为rk0001,cell的值为zhangsan的信息
HBase(main):021:0> get ‘user’, ‘rk0001’, {FILTER => “ValueFilter(=, ‘binary:zhangsan’)”}
在这里插入图片描述
使用get命令指定rowkey与列名模糊查询
获取user表中row key为rk0001,列标示符中含有a的信息
HBase(main):022:0> get ‘user’, ‘rk0001’, {FILTER => “QualifierFilter(=,‘substring:a’)”}
在这里插入图片描述
继续插入一批数据
HBase(main):023:0> put ‘user’, ‘rk0002’, ‘info:name’, ‘fanbingbing’
HBase(main):024:0> put ‘user’, ‘rk0002’, ‘info:gender’, ‘female’
HBase(main):025:0> put ‘user’, ‘rk0002’, ‘info:nationality’, ‘中国’
HBase(main):026:0> get ‘user’, ‘rk0002’, {FILTER => “ValueFilter(=, ‘binary:中国’)”}
在这里插入图片描述
⑤ 查询所有行的数据二
查询user表中的所有信息
使用scan命令
HBase(main):027:0> scan ‘user’
在这里插入图片描述
使用scan命令进行列族查询
查询user表中列族为info的信息
在这里插入图片描述
scan ‘user’, {COLUMNS => ‘info’}
在这里插入图片描述
//当把某些列的值删除后,具体的数据并不会马上从存储文件中删除;查询的时候,不显示被删除的数据;如果想要查询出来的话,RAW => true
scan ‘user’, {COLUMNS => ‘info’, RAW => true, VERSIONS => 5}
在这里插入图片描述
scan ‘user’, {COLUMNS => ‘info’, RAW => true, VERSIONS => 3}
在这里插入图片描述
使用scan命令进行多列族查询
查询user表中列族为info和data的信息
scan ‘user’, {COLUMNS => [‘info’, ‘data’]}
在这里插入图片描述
使用scan命令指定列族与某个列名查询
查询user表中列族为info、列标示符为name的信息
scan ‘user’, {COLUMNS => ‘info:name’}
在这里插入图片描述
查询info:name列、data:pic列的数据
scan ‘user’, {COLUMNS => [‘info:name’, ‘data:pic’]}
在这里插入图片描述
查询user表中列族为info、列标示符为name的信息,并且版本最新的5个
scan ‘user’, {COLUMNS => ‘info:name’, VERSIONS => 5}
在这里插入图片描述
使用scan命令指定多个列族与条件模糊查询
查询user表中列族为info和data且列标示符中含有a字符的信息
scan ‘user’, {COLUMNS => [‘info’, ‘data’], FILTER => “QualifierFilter(=,‘substring:a’)”}
在这里插入图片描述
使用scan命令指定rowkey的范围查询
查询user表中列族为info,rk范围是[rk0001, rk0003)的数据
scan ‘user’, {COLUMNS => ‘info’, STARTROW => ‘rk0001’, ENDROW => ‘rk0003’}
在这里插入图片描述
使用scan命令指定rowkey模糊查询
查询user表中row key以rk字符开头的数据
在这里插入图片描述
使用scan命令指定数据版本的范围查询
查询user表中指定范围的数据(前闭后开)
scan ‘user’, {TIMERANGE => [1392368783980, 1392380169184]}
在这里插入图片描述
hbase(main):039:0> scan ‘user’, {TIMERANGE => [1615386788707,1615386809222]}
在这里插入图片描述
⑥ 更新数据操作
1 更新数据值
更新操作同插入操作一模一样,只不过有数据就更新,没数据就添加
使用put命令
2 更新版本号
将user表的f1列族版本数改为5
HBase(main):040:0> alter ‘user’, NAME => ‘info’, VERSIONS => 5
在这里插入图片描述
⑦ 删除数据以及删除表操作
1 指定rowkey以及列名进行删除
删除user表row key为rk0001,列标示符为info:name的数据(删除一个kv数据)
HBase(main):041:0> delete ‘user’, ‘rk0001’, ‘info:name’
在这里插入图片描述
删除整行数据

hbase(main):024:0> deleteall 't\_user\_info','001'
0 row(s) in 0.0090 seconds
hbase(main):025:0> get 't\_user\_info','001'
COLUMN                            CELL                                                                                            
0 row(s) in 0.0110 seconds

2 指定rowkey,列名以及版本号进行删除
删除user表row key为rk0001,列标示符为info:name,timestamp为1392383705316的数据
hbase(main):042:0> delete ‘user’, ‘rk0001’, ‘info:name’, 1392383705316
在这里插入图片描述
3 删除一个列族
删除一个列族:
alter ‘user’, NAME => ‘info’, METHOD => ‘delete’
或 alter ‘user’, ‘delete’ => ‘info’
在这里插入图片描述
4 清空表数据
HBase(main):045:0> truncate ‘user’
在这里插入图片描述
5 删除表
首先需要先让该表为disable状态,使用命令:
HBase(main):049:0> disable ‘user’
然后使用drop命令删除这个表
HBase(main):050:0> drop ‘user’
在这里插入图片描述
(注意:如果直接drop表,会报错:Drop the named table. Table must first be disabled)
在这里插入图片描述
⑧ 统计一张表有多少行数据
HBase(main):046:0> count ‘user’
在这里插入图片描述

六 HBase的高级shell管理命令

1 status

例如:显示服务器状态
HBase(main):051:0> status ‘node01’
在这里插入图片描述

2 whoami

显示HBase当前用户,例如:
HBase> whoami
在这里插入图片描述

3 list

显示当前所有的表
HBase > list
在这里插入图片描述

4 count

统计指定表的记录数,例如:
HBase> count ‘user’
在这里插入图片描述
为了展示下面功能,然后重新创建user表,并插入数据
创建user表,包含info、data两个列族
使用create命令

hbase(main):008:0> create 'user', 'info', 'data'
0 row(s) in 1.3080 seconds

向表中插入数据
使用put命令
向user表中插入信息,row key为rk0001,列族info中添加名为name的列,值为zhangsan

HBase(main):011:0> put 'user', 'rk0001', 'info:name', 'zhangsan'

向user表中插入信息,row key为rk0001,列族info中添加名为gender的列,值为female

HBase(main):012:0> put 'user', 'rk0001', 'info:gender', 'female'

向user表中插入信息,row key为rk0001,列族info中添加名为age的列,值为20

HBase(main):013:0> put 'user', 'rk0001', 'info:age', 20

向user表中插入信息,row key为rk0001,列族data中添加名为pic的列,值为picture

HBase(main):014:0> put 'user', 'rk0001', 'data:pic', 'picture'

在这里插入图片描述

5 describe

展示表结构信息
HBase> describe ‘user’
在这里插入图片描述

6 exists

检查表是否存在,适用于表量特别多的情况
在这里插入图片描述

7 is_enabled、is_disabled

检查表是否启用或禁用
HBase> is_enabled ‘user’
HBase> is_disabled ‘user’
在这里插入图片描述

8 alter

该命令可以改变表和列族的模式,例如:
为当前表增加列族:
HBase> alter ‘user’, NAME => ‘CF2’, VERSIONS => 2
在这里插入图片描述
为当前表删除列族:
HBase(main):002:0> alter ‘user’, ‘delete’ => ‘CF2’
在这里插入图片描述

9 disable/enable

禁用一张表/启用一张表
HBase> disable ‘user’
HBase> enable ‘user’
在这里插入图片描述

10 drop

删除一张表,记得在删除表之前必须先禁用

11 truncate

禁用表-删除表-创建表

七 Hive与HBase的集成

Hive提供了与HBase的集成,使得能够在HBase表上使⽤HQL语句进⾏查
询 插⼊操作以及进⾏Join和Union等复杂查询、同时也可以将hive表中的
数据映射到Hbase中。
版本说明:
 hbase版本:hbase-1.2.0-cdh5.14.2
 hive版本:hive-1.1.0-cdh5.14.2
数据模型:
row,addres,age,username
001,guangzhou,20,alex
002,shenzhen,34,jack
003,beijing,23,lili
创建HBase的数据:

create 'stu20210308','info'
put 'stu20210308','001','info:addres','guangzhou'
put 'stu20210308','001','info:age','20'
put 'stu20210308','001','info:username','alex'
put 'stu20210308','002','info:addres','shenzhen'
put 'stu20210308','002','info:age','34'
put 'stu20210308','002','info:username','jack'
put 'stu20210308','003','info:addres','beijing'
put 'stu20210308','003','info:age','23'
put 'stu20210308','003','info:username','lili'

在这里插入图片描述
在这里插入图片描述
ps:退出HBASE指令是!quit
创建与HBase集成的Hive的外部表:

CREATE EXTERNAL TABLE stu20210308(
id string,
addres string,
age string,
username string)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES (
"hbase.columns.mapping" =
":key,info:addres,info:age,info:username")
TBLPROPERTIES ("hbase.table.name" = "stu20210308");
hive (test)> CREATE EXTERNAL TABLE stu20210308(
           > id string,
           > addres string,
           > age string,
           > username string)
           > STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
           > WITH SERDEPROPERTIES (
           > "hbase.columns.mapping" =
           > ":key,info:addres,info:age,info:username")
           > TBLPROPERTIES ("hbase.table.name" = "stu20210308");
OK
Time taken: 1.933 seconds
hive (test)> select \* from stu20210308;
OK
stu20210308.id  stu20210308.addres      stu20210308.age stu20210308.username
001     guangzhou       20      alex
002     shenzhen        34      jack
003     beijing 23      lili
Time taken: 0.09 seconds, Fetched: 3 row(s)

在这里插入图片描述
ps:具体这里可查看Hive与HBase的集成
Hive表映射HBase实例二
建HBase表
hbase(main):018:0> create ‘user_info’,‘info’
数据插入HBase
info:order_amt
info:order_id
info:user_id
info:user_name
在这里插入图片描述
建hive映射表

create external table wedw_tmp.t_user_info
(
id        string
,order_id  string
,order_amt string
,user_id   string
,user_name string
)
STORED by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
with serdeproperties("hbase.columns.mapping"=":key,info:order\_id,info:order\_amt,info:user\_id,info:user\_name")
tblproperties("hbase.table.name"="user\_info");

查询映射好的hive表
select * from wedw_tmp.t_user_info;
在这里插入图片描述

八 HBase客户端API操作

表创建
增加数据
删除数据
全表扫描
过滤器
匹配

九 phoenix操作HBase

Phoenix,由saleforce.com 开源的一个项目,后又捐给了Apache。它相当于一个Java 中间件,帮助开发者,像
使用jdbc 访问关系型数据库一样,访问NoSql 数据库HBase。
Apache Phoenix 与其他Hadoop 产品完全集成,如Spark,Hive,Pig,Flume 和MapReduce。

1 安装pheonix
1.1 下载pheonix

http://phoenix.apache.org/download.html
注意:下载Phoenix 的时候,请注意对应的版本,其中4.14 版本可以运行在HBase0.98、1.1、1.2、1.3、1.4 上。
下载时也可以直接使用:

wget http://mirrors.shu.edu.cn/apache/phoenix/apache-phoenix-4.14.0-HBase-1.2/bin/apache-phoenix-4.14.0-HBase-1.2-bin.tar.gz

1.2 解压pheonix
tar -zxvf apache-phoenix-4.14.0-HBase-1.2-bin.tar.gz

在这里插入图片描述

1.3 整合phoenix到hbase

查看Phoenix 下的所有的文件,将phoenix-4.14.0-HBase-1.2-server.jar 拷贝到所有HBase 节点(包括Hmaster以及HregionServer)的lib 目录下:

重启HBase:
bin/stop-hbase.sh
bin/start-hbase.sh

1.4 使用phoenix SQL命令行

进入Phoenix 的安装包,执行:

bin/sqlline.py bigdata1:2181

在这里插入图片描述

1.4.1 创建表

在Phoenix 终端下创建us_population 表:

>> CREATE TABLE IF NOT EXISTS us_population (
state CHAR(2) NOT NULL,
city VARCHAR NOT NULL,
population BIGINT
CONSTRAINT my_pk PRIMARY KEY (state, city));

使用!tables 查看创建的表:

>> !tables

在这里插入图片描述

1.4.2 编辑并导入数据

在Phoenix 目录下创建一个data 目录,在data 目录下创建:
vi us_population.csv

NY,New York,8143197
CA,Los Angeles,3844829
IL,Chicago,2842518
TX,Houston,2016582
PA,Philadelphia,1463281
AZ,Phoenix,1461575
TX,San Antonio,1256509
CA,San Diego,1255540
TX,Dallas,1213825
CA,San Jose,912332

执行bin/psql.py data/us_population.csv 导入数据。
除了导入数据外,还可以使用Phoenix 的语法插入数据:upsert into us_population values(‘NY’,‘NewYork’,8143197);

1.4.3 查询数据

方式一:在data 目录下创建us_population_queries.sql 文件:

SELECT state as "State",count(city) as "City Count",sum(population) as "Population Sum"
FROM us_population
GROUP BY state
ORDER BY sum(population) DESC;

执行bin/psql.py data/us_population_queries.sql 检索数据。
方式二:使用命令行终端

bin/sqlline.py bigdata1:2181
>> select \* from us_populcation;

在这里插入图片描述

2 Squirrel-sql 连接Phoenix
2.1 下载Squirrel-sql

http://www.squirrelsql.org/#installation

2.2 设置Squirrel-sql 连接Phoenix

拷贝Phoenix Client jar【phoenix-4.14.0-HBase-1.2-client.jar】到Squirrel-sql 的lib 目录;
在这里插入图片描述
设置Phoenix 连接的Driver 信息,其中localhost 为zookeeper 所在的主机地址,填写一个即可。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3 Phoenix 映射Hbase 表

进入Hbase 命令行终端bin/hbase shell
创建Hbase 表’phoenix’:

– 创建Hbase 表Phoenix,列族info
create ‘phoenix’,‘info’

– 添加数据
put ‘phoenix’, ‘row001’,‘info:name’,‘phoenix’
put ‘phoenix’, ‘row002’,‘info:name’,‘hbase’

映射HBase 表的方式有两种,一直是视图映射,一种是表映射。
两者的区别就是对HBase 的物理表有没有影响;

做了那么多年开发,自学了很多门编程语言,我很明白学习资源对于学一门新语言的重要性,这些年也收藏了不少的Python干货,对我来说这些东西确实已经用不到了,但对于准备自学Python的人来说,或许它就是一个宝藏,可以给你省去很多的时间和精力。

别在网上瞎学了,我最近也做了一些资源的更新,只要你是我的粉丝,这期福利你都可拿走。

我先来介绍一下这些东西怎么用,文末抱走。


(1)Python所有方向的学习路线(新版)

这是我花了几天的时间去把Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

最近我才对这些路线做了一下新的更新,知识体系更全面了。

在这里插入图片描述

(2)Python学习视频

包含了Python入门、爬虫、数据分析和web开发的学习视频,总共100多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。

在这里插入图片描述

(3)100多个练手项目

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。

在这里插入图片描述

(4)200多本电子书

这些年我也收藏了很多电子书,大概200多本,有时候带实体书不方便的话,我就会去打开电子书看看,书籍可不一定比视频教程差,尤其是权威的技术书籍。

基本上主流的和经典的都有,这里我就不放图了,版权问题,个人看看是没有问题的。

(5)Python知识点汇总

知识点汇总有点像学习路线,但与学习路线不同的点就在于,知识点汇总更为细致,里面包含了对具体知识点的简单说明,而我们的学习路线则更为抽象和简单,只是为了方便大家只是某个领域你应该学习哪些技术栈。

在这里插入图片描述

(6)其他资料

还有其他的一些东西,比如说我自己出的Python入门图文类教程,没有电脑的时候用手机也可以学习知识,学会了理论之后再去敲代码实践验证,还有Python中文版的库资料、MySQL和HTML标签大全等等,这些都是可以送给粉丝们的东西。

在这里插入图片描述

这些都不是什么非常值钱的东西,但对于没有资源或者资源不是很好的学习者来说确实很不错,你要是用得到的话都可以直接抱走,关注过我的人都知道,这些都是可以拿到的。

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值