Hive版本信息对比0.14.0-2.1.1

本文对比了Hive从0.14.0到2.1.1的主要版本,详细列举了各版本的新特性、不兼容的改变以及对Hadoop的依赖。自0.14.0引入ACID特性和成本基础优化器以来,Hive经历了多个重大更新,包括增加新函数、优化SQL支持、改进性能,以及对Hadoop版本的支持变化。在2.1.1版本中,亮点包括对parquet文件的向量化查询支持和对窗口和分析函数的增强。此外,还介绍了在Hive on Spark、表和分区的静态信息编辑等方面的变化。
摘要由CSDN通过智能技术生成

Hive版本信息对比0.14.0-2.1.1

目前大数据集群的hive主要版本为0.14.0,版本日期为2014.11.13。为了适应大数据的不断发展和更新换代,特此分享Hive主要版本信息,为版本升级做准备。

Hive分支理解

自2015年6月起,hive有两个主线,master版本和branch-1版本:
1).hive所有的新特性和bug修复都被提交到master版本。自2015年6月起,master线的release被编号为2.x。2.x版本不一定向后兼容1.x。
2).branch-1是用于构建稳定、向后兼容的版本。从这个branch的release被编号为1.x(1.3将是第一个版本)。至少到2016年6月所有重要的bug修复(crashes, wrong results, security issues)应用于master也必须适用于为branch-1。决定港口功能从主为1是自由裁量权的贡献者和提交者。然而没有特性,打破向后兼容性将被接受为1。贡献者和提交者决定将部分特性从master版本移到branch-1版本。而不需要打破向后兼容的特性时,建议使用branch-1。

除了这些主线外,hive有两种类型的分支,release分支和feature分支:
1).当社区准备一个hive release时,release分支由branch-1(1.x)或master(2.x)建立。release分支匹配release的编号(例如,branch-1.2匹配hive 1.2)。对补丁release,分支是由现有的发布分支建立(为了避免从master接新功能)。例如,如果要建立release 1.2.1,branch-1.2.1将始于branch-1.2。一旦release 分支被建立,分支(包括额外补丁)由发布经理自由处理。在一个release 分支建立后,额外的bug修复仍然可以应用于该分支预期的下一个补丁发布。任何bug修复应用到release分支,首先必须被应用到master(和branch-1,如果适用的话)。
2).feature分支用于开发稳定hive的新功能。feature分支的目的是,一旦特性稳定它将被合并回master。

hadoop依赖

master和branch-1在hadoop依赖上的处理是不同的:

branch-1
同时支持hadoop 1.x和2.x。为了编译“shims”、允许这些Hadoop版本兼容,hive通过Maven构建下载不同版本的Hadoop。然而,hive的其余部分只是构建和测试一个单独的Hadoop版本。
Maven构建有两个配置文件,hadoop-1和hadoop-2。构建时,你必须指定你希望使用的配置文件,通过Maven的-P命令行选项。

master
hive的master分支不再支持hadoop 1.x。对大部分的maven命令来说,不需要再指定配置文件,因为hadoop 2.x是默认选择。

版本信息

原始版本:0.14.0
版本日期:2014.11.13
第三方版本信息:HDP2.2.6
目标版本:2.1.1
版本日期:2016.12.8
第三方版本信息:CDH6.0.1

Release 0.14.0

Date:2014年11月12日
Hadoop版本:1.x.y, 2.x.y

新特性
[HIVE-5317] -在hive中执行insert、update、delete满足ACID的全部要求(原子性、一致性、隔离性、持久性)
[HIVE-5775] -引进基于消耗(cost)的控制器
[HIVE-5823] -支持在AvroSerDe中的DECIMAL原始类型
[HIVE-6455] -可伸缩的动态分区和bucketing优化
[HIVE-6469] -在hive命令行的skipTrash选项
[HIVE-6806] -CREATE TABLE 支持 STORED AS AVRO
[HIVE-7036] -get_json_object bug when extract list of list with index
[HIVE-7054] -在向量模型支持ELT、UDF
[HIVE-7068] -集成AccumuloStorageHandler
[HIVE-7090] -支持session级别的临时表
[HIVE-7158] -使用Tez auto-parallelism
[HIVE-7203] - Optimize limit 0
[HIVE-7255] -analyze命令允许指定部分分区
[HIVE-7299] –可配置metadata只在Tez优化
[HIVE-7341] -支持通过HCatalog实例复制table
[HIVE-7390] -在BeeLine 输出(CSV/TSV)可使用单引号配置和选择
[HIVE-7416] -为权限检查认证api调用,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值