hbase和hive的区别是什么？怎么区分两者之间的关系？

最新推荐文章于 2023-03-09 12:55:46 发布

老子天下最美

最新推荐文章于 2023-03-09 12:55:46 发布

阅读量7.9k

点赞数 6

HIVE：

hive，是一款开源的数据仓库

1、hive不是数据库，而是数据仓库，主要依赖于hadoop来实现

2、底层文件系统是hadoop的hdfs，实现对hdfs上结构化数据的SQL操作HQL，速度较慢

3、计算引擎是hadoop的mapreduce

4、依靠存储在其他关系型数据库metastore来对hdfs结构化数据进行管理，实现类似数据库的功能

5、不具备数据库的一些主键、索引、update操作等特性，但是提供了分区、块索引、SQL等特性

6、比较适合存储海量的全量（历史+更新）轨迹数据，比对数据进行批量的挖掘、分析等操作

总结一下，hive是基于hadoop实现的数据仓库，适合存储海量全量数据，支持类SQL操作，性能相对较差，数据存储

有一定的限制，不支持更新、索引等事务。适合海量数据的挖掘和分析，通俗一点来说，hive其实就是借助mysql等数据库在

hadoop上层套了一个壳，来实现对hdfs上结构化数据的映射，为上层提供sql服务。

HBASE：

即Hadoop databse，顾名思义就是一个hadoop的数据库

1、nosql数据库之一，基于列式存储（列族），适合海量半结构化数据的存储和检索

2、不支持SQL、适合海量、带时间序列的数据的存储和检索、性能较好

3、原生支持基于rowkey的一级索引，rowkey按照字典序进行排序

4、运算执行引擎是hbase自身提供、底层存储基于hdfs

总结一下，hbase是NOSQL数据库的一种，基于分布式列式存储，适合海量半结构化带时间序列的数据的存储和检索，性能较优秀，hbase底层存储依赖于hdfs，与rdbms的区别与其他nosql类似，比如不支持SQL、事务性相对较差等等。

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------

综上，hbase是数据库、hive是数据仓库，而这有很大的区别、也有很多类似的地方比如都属于hadoop生态圈、存储都基于hdfs等。一般来说用hive作为海量结构化全量数据的存储、运算、挖掘、分析；hbase用来作为海量半结构化数据的存储、检索；这二者可以很好协同工作，hive上计算完的结果放在hbase中供检索，也可以将hbase里面的结构化数据和hive相结合，实现对hbase的sql操作等等。

--------------------- 作者：zx8167107 来源：CSDN 原文：https://blog.csdn.net/zx8167107/article/details/79265537?utm_source=copy 版权声明：本文为博主原创文章，转载请附上博文链接！

老子天下最美

关注

6
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
hbase和hive的区别是什么？怎么区分两者之间的关系？

HIVE：hive，是一款开源的数据仓库1、hive不是数据库，而是数据仓库，主要依赖于hadoop来实现2、底层文件系统是hadoop的hdfs，实现对hdfs上结构化数据的SQL操作HQL，速度较慢3、计算引擎是hadoop的mapreduce4、依靠存储在其他关系型数据库metastore来对hdfs结构化数据进行管理，实现类似数据库的功能5、不具备数据库的一...
复制链接

扫一扫

老子天下最美 CSDN认证博客专家 CSDN认证企业博客

码龄6年

39: 原创

18万+: 周排名

100万+: 总排名

17万+: 访问

: 等级

1773: 积分

46: 粉丝

117: 获赞

27: 评论

430: 收藏

私信

关注

热门文章

分类专栏

最新评论

什么是线程阻塞?为什么会出现线程阻塞？
SockeBoy: 博主写错了，sleep方法后cpu执行权交出去了，但是对象锁没有释放。
什么是线程阻塞?为什么会出现线程阻塞？
m0_61789314: 的确有点误人子弟
什么是线程阻塞?为什么会出现线程阻塞？
keep thinking: 1.睡眠状态：当一个线程执行代码的时候调用了sleep方法后，线程处于睡眠状态，需要设置一个睡眠时间，此时分为两种情况，（1）如果当前线程所在的环境是被一把独享锁锁住的，有其他线程需要执行时就会将其它线程在当前线程的睡眠时间内一直让其在环境外面排队等待获取锁，就会造成线程阻塞。（2）如果当前线程所在的环境是把一把共享锁锁住的，或者干脆当前环境没有锁，则当前线程睡眠后，其它线程是有机会获取锁的，并且有机会执行的。且当前线程睡眠时间过后，也并不是第一时间就可以获取到CPU执行权的，它需要同其它线程进行争夺。综上所述：sleep方法被调用之后，线程不会释放锁对象，也就是说锁还在该线程手里，CPU执行权会被释放掉，等睡眠时间一过，该线程就会进入就绪状态，典型的“占着茅坑不拉屎”；至于是否执行还得根据具体情况分析
什么是scala?scala有什么用？
JimmyStudyEve: 什么叫优雅？
什么是线程阻塞?为什么会出现线程阻塞？
StromanStroman: 你对线程阻塞的解释不明白。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。