1.Hive与传统数据仓库的比较

本文对比了Hive与传统数据仓库在存储、执行引擎、使用方式、灵活性、分析速度、索引、易用性、可靠性、依赖环境和价格等方面的差异。Hive在大数据处理上更具优势,而传统数据仓库在查询速度和成熟解决方案上表现出色。
摘要由CSDN通过智能技术生成

1》存储:

1.Hive是存储在HDFS,理论上有无限扩展的可能性,因为从文件角度进行理解,hdfs是一个文件夹。

2.传统型数据仓库,集群存储,存在容量上限的情况,扩充表容量也有限制,计算速度会急剧下降,只能适应于数据量比较小的商业应用,对于超大规模数据是无能为力的

2》执行引擎

1、HIVE依赖于MR框架,可进行各类优化比较少,但是比较简单。

2.传统数据仓库可以选择更高效的算法来执行查询,也可以进行更多的优化措施来提高速度。

3》使用方式

1.Hive使用的是HQL(类似SQL)

2.传统数据仓库使用的是sql

4》灵活性

1.hive元数据存储独立于数据存储之外,从而解耦元数据和数据。(因为hive是开源的)

2.传统型数据仓库的灵活性是十分低的,数据用途单一。

5》分析速度

1.hive计算依赖于MapReduce和集群规模,容易去进行拓展,在大数据的情况下远远大于普通的数据仓库。

6》索引

1.hive索引是比较低效的。目前还不完善

2.传统数据仓库是高效的,因为有类似B+树,以及B树之类健全的索引,因此在查询的速度是十分快的。

7》易用性

1.hive需要自行开发应用模型,灵活度比较高,但是易用性会比较差。

2.传统的数据仓库集成了一整套成熟的报表解决方案,可

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值