2 添加数据
HBase使用put命令添加数据,一次只能为一个表的一行数据的一个列(也就是一个单元格,单元格是HBase中的概念)添加一个数据,所以,直接用Shell命令插入数据效率很低,在实际应用中,一般都是利用编程操作数据。因为这里只要插入1条学生记录,所以,我们可以用Shell命令手工插入数据,命令如下:
hbase> put 'student','95001','Sname','LiYing'
上面的put命令会为student表添加学号为95001
、名字为LiYing
的一个单元格数据,其行键为95001
,也就是说,系统默认把跟在表名student后面的第一个数据作为行健。
下面继续添加4个单元格的数据,用来记录LiYing
同学的相关信息,命令如下:
hbase> put 'student','95001','Ssex','male' hbase> put 'student','95001','Sage','22' hbase> put 'student','95001','Sdept','CS' hbase> put 'student','95001','course:math','80'
3 查看数据
HBase中有两个用于查看数据的命令:
- get命令:用于查看表的某一个单元格数据;
- scan命令:用于查看某个表的全部数据。
比如,可以使用如下命令返回student表中95001行的数据:
hbase> get 'student','95001'
下面使用scan命令查询student表的全部数据:
hbase> scan 'student'
4 删除数据
在HBase中用delete以及deleteall
命令进行删除数据操作,二者的区别是:delete
命令用于删除一个单元格数据,是put的反向操作,而 deleteall
命令用于删除一行数据。
首先,使用delete命令删除student表中95001这行中的Ssex
列的所有数据,命令如下:
hbase > delete 'student','95001','Ssex'
然后,使用deleteall
命令删除student表中的95001
行的全部数据,命令如下:
hbase> deleteall 'student','95001'
5 删除表
删除表需要分两步操作,第一步先让该表不可用,第二步删除表。比如,要删除student
表,可以使用如下命令:
hbase> disable 'student' hbase> drop 'student'
6 查询历史数据
在添加数据时,HBase会自动为添加的数据添加一个时间戳。在修改数据时,HBase会为修改后的数据生成一个新的版本(时间戳),从而完成“改”操作,旧的版本依旧保留,系统会定时回收垃圾数据,只留下最新的几个版本,保存的版本数可以在创建表的时候指定。
为了查询历史数据,这里创建一个teacher表,首先,在创建表的时候,需要指定保存的版本数(假设指定为5),命令如下:
hbase> create 'teacher',{NAME=>'username',VERSIONS=>5}
然后,插入数据,并更新数据,使其产生历史版本数据,需要注意的是,这里插入数据和更新数据都是使用put命令,具体如下:
hbase> put 'teacher','91001','username','Mary' hbase> put 'teacher','91001','username','Mary1' hbase> put 'teacher','91001','username','Mary2' hbase> put 'teacher','91001','username','Mary3' hbase> put 'teacher','91001','username','Mary4' hbase> put 'teacher','91001','username','Mary5'
查询时,默认情况下回显示当前最新版本的数据,如果要查询历史数据,需要指定查询的历史版本数,由于上面设置了保存版本数为5,所以,在查询时制定的历史版本数的有效取值为1到5,具体命令如下:
hbase> get 'teacher','91001',{COLUMN=>'username',VERSIONS=>5} hbase> get 'teacher','91001',{COLUMN=>'username',VERSIONS=>3}
7 退出HBase数据库
最后退出数据库操作,输入exit命令即可退出,命令如下:
hbase> exit
注意,这里退出HBase数据库是退出HBase Shell,而不是停止HBase数据库后台运行,执行exit后,HBase仍然在后台运行,如果要停止HBase运行,需要使用如下命令:
$ bin/stop-hbase.sh
作业:使用Shell命令完成以下内容。(每道题目不仅要给出命令还要有运行结果截图)
- 创建《王者荣耀》游戏玩家信息表gamer,包含列族personalInfo(个人信息)、recordInfo(战绩信息)、assetsInfo(资产信息)。
create ‘gamer’, ‘personalInfo’, ‘recordInfo’, ‘assetsInfo’
describe ‘gamer’
alter ‘gamer’,{NAME=>‘recordInfo’,TTL=>‘15552000’}
personalInfo | recordInfo | assetInfo | |
nickname | gameID | ranking | |
row-001 | QGhappy.Snow | 000000 | One |
row-002 | XQMaster | 111111 | Two |
put ‘gamer’,‘row-001’,‘personalInfo:nickname’,‘QGhappy.Snow’
put ‘gamer’,‘row-001’,‘recordInfo:ranking’,‘one’
put’gamer’,‘row-001’,‘assetsInfo:integral’,‘10000’
put ‘gamer’,‘row-001’,‘personalInfo:gameId’,‘000000’
put ‘gamer’,‘row-002’,‘personalInfo:nickname’,‘XQMaster’
put ‘gamer’,‘row-002’,‘recordInfo:ranking’,‘two’
put ‘gamer’,‘row-002’,‘assetsInfo:integral’,‘20000’
put ‘gamer’,‘row-002’,‘personalInfo:gameId’,‘111111’
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数大数据工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上大数据开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)
一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上大数据开发知识点,真正体系化!**
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)
[外链图片转存中…(img-2lAwFdq0-1712975083886)]
一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!