spark 表关联 java_Spark中Oracle表间的java join

最新推荐文章于 2021-11-15 11:31:50 发布

合光聚乐

最新推荐文章于 2021-11-15 11:31:50 发布

阅读量172

点赞数

文章标签： spark 表关联 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42519214/article/details/114810196

版权

在spark中进行 join操作之前，可以在oracle和spark中为 join查询创建一些性能矩阵，并 root据观察结果决定选择哪一个。几乎没有分析的指针，

如果 DataSet 的大小和 join操作足够大，不会在oracle DB中增加性能问题，那么在源(oracle)本身中执行 join操作。

希望这些指针有助于理解是否使用spark。

在这里，我将保留下面的答案，供您在spark选项中进行选择。

您可以通过以下两种方式来完成：为每个表创建dataframe、执行join操作、在spark内存中的register temp表之后以及在其上执行类似于oracle的sql查询。

下面是 DataSet 操作的示例代码，

Dataset jdbcDF1 = spark.read()

.format("jdbc")

.option("url", "oracle.jdbc.driver.OracleDriver")

.option("dbtable", "schema.table1")

.option("user", "username")

.option("password", "password")

.load();

Dataset jdbcDF2 = spark.read()

.format("jdbc")

.option("url", "oracle.jdbc.driver.OracleDriver")

.option("dbtable", "schema.table2")

.option("user", "username")

.option("password", "password")

.load();

jdbcDF1.join(jdbcDF1, jdbcDF1.col("id").equalTo(jdbcDF2.col("id")))

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark 表关联 java_Spark中Oracle表间的java join

在spark中进行 join操作之前，可以在oracle和spark中为 join查询创建一些性能矩阵，并 root据观察结果决定选择哪一个。几乎没有分析的指针，如果 DataSet 的大小和 join操作足够大，不会在oracle DB中增加性能问题，那么在源(oracle)本身中执行 join操作。希望这些指针有助于理解是否使用spark。在这里，我将保留下面的答案，供您在spark选项中进行...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。