spark 表关联 java_Spark中Oracle表间的java join

在spark中进行 join操作之前,可以在oracle和spark中为 join查询创建一些性能矩阵,并 root据观察结果决定选择哪一个。几乎没有分析的指针,

如果 DataSet 的大小和 join操作足够大,不会在oracle DB中增加性能问题,那么在源(oracle)本身中执行 join操作。

希望这些指针有助于理解是否使用spark。

在这里,我将保留下面的答案,供您在spark选项中进行选择。

您可以通过以下两种方式来完成:为每个表创建dataframe、执行join操作、在spark内存中的register temp表之后以及在其上执行类似于oracle的sql查询。

下面是 DataSet 操作的示例代码,

Dataset jdbcDF1 = spark.read()

.format("jdbc")

.option("url", "oracle.jdbc.driver.OracleDriver")

.option("dbtable", "schema.table1")

.option("user", "username")

.option("password", "password")

.load();

Dataset jdbcDF2 = spark.read()

.format("jdbc")

.option("url", "oracle.jdbc.driver.OracleDriver")

.option("dbtable", "schema.table2")

.option("user", "username")

.option("password", "password")

.load();

jdbcDF1.join(jdbcDF1, jdbcDF1.col("id").equalTo(jdbcDF2.col("id")))

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值