Spark系列之:使用spark合并hive数据库多个分区的数据到一个分区中
- 把两个分区的数据合并到同一个分区下
- 把其中一个分区的数据通过append方式添加到另一个分区即可
%spark
val df = spark.sql("select * from optics_prod.product_1h_a where datetime='2023111423'")
.repartition(10)
.write.mode(
本文介绍了如何使用Spark将Hive数据库中的多个分区数据整合到一个新的单一分区中,通过append方式实现数据合并,简化数据管理和查询。
%spark
val df = spark.sql("select * from optics_prod.product_1h_a where datetime='2023111423'")
.repartition(10)
.write.mode(
1568
616
1610

被折叠的 条评论
为什么被折叠?