Spark 3.0版本从2020年6月份正式发版以来,已经过了一个季度了,其稳定版本也在 9月份release了。
Spark SQL 3的性能强劲,且很好的兼容了Hive的各个版本,可以选其作为ETL的工具,替代Hive,更加有效的利用好资源。
Spark3.x的系列文章主要是用来记录Spark3在各种场景下的使用,期望可以供也期望使用强大的Spark引擎的各位小伙伴一些案例参考,一同的用好开源软件。
这个系列文章的列表如下:
2.Spark SQL 3.0.1 与 CDH Hive 2.1.1结合
我将持续的将自己所经历的实践案例写入到这个系列的文章中,加油。