Spark(33) -- Spark SQL补充 -- 连接

本文详细介绍了Spark SQL中的连接操作,包括无类型连接算子join的API使用,连接类型的选择,以及广播连接的原理和优化。通过具体案例展示了如何进行表连接,并解释了Map端Join的实现和自动触发条件,强调了broadcast函数在优化连接操作中的作用。
摘要由CSDN通过智能技术生成

1. 无类型连接算子 join 的 API

Step 1: 什么是连接
 按照 PostgreSQL 的文档中所说, 只要能在一个查询中, 同一时间并发的访问多条数据, 就叫做连接.
做到这件事有两种方式

 一种是把两张表在逻辑上连接起来, 一条语句中同时访问两张表

select * from user join address on user.address_id = address.id

 还有一种方式就是表连接自己, 一条语句也能访问自己中的多条数据


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

erainm

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值