hadoop3版本的兼容性简单调研

最新推荐文章于 2025-04-30 10:28:07 发布

原创最新推荐文章于 2025-04-30 10:28:07 发布

· 4.8k 阅读

·

3

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#hadoop3 #hive #hbase

大数据专栏专栏收录该内容

92 篇文章

订阅专栏

hadoop3版本的兼容性简单调研

目录：

1. 与其他组件的兼容性版本

2. 与hadoop2版本的客户端兼容性

一. 与其他组件的兼容性版本

目前依赖hadoop的常用组件有spark、 hive、hbase 等. 目前只调研hive 和 hbase 这两个重要组件。

参考组件的官网发布信息，一般每个版本的发布信息会说明已经支持那个hadoop版本的底层服务，说明

已经经过官网比较系统的测试了。

1.1 hive：

摘录官网的信息：

1 November 2018: release 3.1.1 available

This release works with Hadoop 3.x.y. You can look at the complete JIRA change log for this release.

30 July 2018: release 3.1.0 available

This release works with Hadoop 3.x.y. You can look at the complete JIRA change log for this release.

21 May 2018 : release 3.0.0 available

This release works with Hadoop 3.x.y. The on-disk layout of Acid tables has changed with this release. Any Acid table partition that had Update/Delete/Merge statement executed since the last Major compaction must execute Major compaction before upgrading to 3.0. No more Update/Delete/Merge may be executed against these tables since the start of Major compaction. Not following this may lead to data corruption. Tables/partitions that only contain results of Insert statements are fully compatible and don't need to be compacted. You can look at the complete JIRA change log for this release.

可知，目前hive的三个罪行版本是支持hadoop3.x.y系列的，分别为：3.0.0、3.1.0、3.1.1。

1.2 hbase

参考hbase官网的支持矩阵：

可知，Hbase2.0.x 和 Hbase2.1.x支持hadoop3.0.3+、hadoop3.1.1+；

Hbase2.1.x支持hadoop3.1.1+；

二. 与hadoop2版本的客户端的兼容性

目前测试可以兼容hadoop2的客户端（rpc兼容），可以继续使用，但是一些新功能不能正常使用，且一些shell脚本发生了很大变化。

持续更新。。。。。

博客等级

码龄9年

116
原创

284
点赞

1037
收藏

119
粉丝

关注

私信

热门文章

分类专栏

hadoop 20篇
flink 4篇
面试 19篇
hbase 26篇
HDFS 2篇
数据湖 5篇
clickhouse
其他 4篇
janusgraph 2篇
关系型数据库 3篇
项目管理 15篇
网络编程 6篇
编程基础 28篇
java 65篇
大数据专栏 92篇
linux内核&运维 34篇

展开全部收起

上一篇：: Hadoop 2.7.3之后到最新的Hadoop3.2.0的主要新特性

下一篇：: Hadoop 3.0纠删码简单调研

最新评论

HBase MemStore简介
大树Frank: 写得太好了，解决了我很久的困惑
StampedLock原理分析
机械广: 背景那块我有些疑问：在读线程非常多，写线程很少的情况下，很容易导致写线程“饥饿”。 ReentrantReadWriteLock的加读锁的源码，要判断等待队列的头部是否为写锁，如果是写锁，读锁就会在等待队列中等待，防止写饥饿。那么这种形式还是无法完全解决写饥饿吗？
读写锁饥饿问题解决方案之StampedLock
AlgorithmNotes: StampedLock是基于CLH锁原理实现的, CLH是一种基于排队思想实现的自旋锁，可以保证FIFO(先进先出)的服务顺序，所以会避免写线程饥饿问题，其实就是其中实现了一个队列,每次不管是读锁也好写锁也好,未拿到锁就加入队列,然后每次解锁后队列头存储的线程节点获取锁,以此避免饥饿。 ———————————————— 非公平下也会饥饿的吧
给定a、b两个文件，各存放50亿个url，每个url各占64字节，内存限制是4G，让你找出a、b文件共同的url?
empty_coder: step3 里似乎没有强调如何避免重复 url 的存入。一种修改意见：求每对小文件 ai 和 bi 中相同的 url 时，可以把 ai 的 url 存储到 HashMap 中（Entry<url, cnt=0>），然后遍历 bi 的每个 url，看其是否在刚才构建的 HashMap 中且出现次数为 0。如果符合条件，就是共同且不重复的 url，更新 HashMap 对应 Entry<url, cnt++>，并将 url 存到新的文件里面
hdfs之WebHDFS和HttpFS介绍
magic_kid_2010: 使用 webhdfs 50070 端口访问，重定向到该资源所在的datanode。如果 hadoop 配置的副本数量是3。写入时是 datanode 写入完成就返回，还是要等副本都完成再返回呢？如果不等副本都完成，如果此时 datanode 挂了，但是写入返回了，是不是会导致数据丢失了？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。