Hive2.0新特性


转载自:http://www.36dsj.com/archives/60604

Apache Hive2.0的新特性介绍

hive

Hive 是一个基于 Hadoop 文件系统之上的数据仓库架构。它为数据仓库的管理提供了许多功能:数据 ETL (抽取、转换和加载)工具、数据存储管理和大型数据集的查询和分析能力。同时 Hive 还定义了类 SQL的语言 – Hive QL. Hive QL 允许用户进行和 SQL 相似的操作,它可以将结构化的数据文件映射为一张数据库表,并提供简单的 SQL 查询功能。还允许开发人员方便地使用 Mapper 和 Reducer 操作,可以将 SQL 语句转换为 MapReduce 任务运行,这对 MapReduce 框架来说是一个强有力的支持。


总结hive2.x优化如下:

肯定不全或者不准确,请大神不吝赐教!!

1.添加对存储过程的支持
2.支持游标,循环
3.并匹配方言sql,以达到最大化重用脚本
4.使用接口,来保证其他数据引擎在并发中安全的读取数据
5.live long and process (LLAP) 提高hive的执行效率
5.支持动态分区的修剪
6.支持并发排序(1.x已经支持了吧???)


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值