Hive与HBase同在Hadoop生态体系内。Hive可以看作Hadoop的SQL编程接口;HBase则是真正意义上的存储海量数据的分布列式数据库。生产环境中,HBase用作线上实时数据库,Hive用在离线数据处理、数据仓库领域。
HBase中查询数据,不能使用大众熟知的SQL,也不支持复杂的查询。如果能使用Hive查询及操作HBase存储的数据,实现二者的互通互导,相互操作,那么其中的便利性不言而喻。
首先不了解HBase的亲可以看一下我之前写过的一篇博文:
《白话解读:SQL与NoSQL》https://blog.csdn.net/osvyxcbttw/article/details/119543418?spm=1001.2014.3001.5501
一、那么看完之后我们先来简单了解一下HBase如何存放数据及对应语法:
HBase 建一张学生表,Row Key是学生编号,两个column family分别为基本信息(info)、地址(address)。
1.行键:决定一行数据。