- 博客(2)
- 收藏
- 关注
原创 Spark 2 迁移 Spark 3 参考手册
Apache Spark是一个广泛应用于大规模数据处理的开源统一分析引擎。自发布以来,它已经成为大数据处理的事实标准。2020年发布的Spark 3.0带来了许多新特性和改进,极大地提升了性能和易用性。如果你习惯使用Spark 2,那么了解新版本的变化将非常有帮助。本文将重点介绍Spark 2和Spark 3在语法上的主要差异,帮助开发者顺利过渡到新版本。希望这篇文章能为你在Spark 3上的开发提供一些有用的参考。
2024-08-07 14:43:07 537
原创 手把手教你Hadoop2迁移Hadoop3 详细教程
本文详细介绍了在CentOS 7.9上配置Hadoop和Hive的源集群与目标集群的步骤,并描述了通过DistCp工具和导入/导出方式进行ORC表数据迁移的过程。本文主要包含三个部分:环境配置、Kerberos配置和数据迁移方案。
2024-08-05 14:37:14 704
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人