1.Hive与传统数据仓库的比较

最新推荐文章于 2024-07-24 20:46:25 发布

qq_35561207

最新推荐文章于 2024-07-24 20:46:25 发布

阅读量3.3k

点赞数 1

分类专栏：大数据组件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35561207/article/details/86367683

版权

本文对比了Hive与传统数据仓库在存储、执行引擎、使用方式、灵活性、分析速度、索引、易用性、可靠性、依赖环境和价格等方面的差异。Hive在大数据处理上更具优势，而传统数据仓库在查询速度和成熟解决方案上表现出色。

摘要由CSDN通过智能技术生成

1》存储：

1.Hive是存储在HDFS，理论上有无限扩展的可能性，因为从文件角度进行理解，hdfs是一个文件夹。

2.传统型数据仓库，集群存储，存在容量上限的情况，扩充表容量也有限制，计算速度会急剧下降，只能适应于数据量比较小的商业应用，对于超大规模数据是无能为力的。

2》执行引擎

1、HIVE依赖于MR框架，可进行各类优化比较少，但是比较简单。

2.传统数据仓库可以选择更高效的算法来执行查询，也可以进行更多的优化措施来提高速度。

3》使用方式

1.Hive使用的是HQL（类似SQL）

2.传统数据仓库使用的是sql

4》灵活性

1.hive元数据存储独立于数据存储之外，从而解耦元数据和数据。（因为hive是开源的）

2.传统型数据仓库的灵活性是十分低的，数据用途单一。

5》分析速度

1.hive计算依赖于MapReduce和集群规模，容易去进行拓展，在大数据的情况下远远大于普通的数据仓库。

6》索引

1.hive索引是比较低效的。目前还不完善

2.传统数据仓库是高效的，因为有类似B+树，以及B树之类健全的索引，因此在查询的速度是十分快的。

7》易用性

1.hive需要自行开发应用模型，灵活度比较高，但是易用性会比较差。

2.传统的数据仓库集成了一整套成熟的报表解决方案，可

最低0.47元/天解锁文章

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。