- 博客(1)
- 收藏
- 关注
原创 Hive on spark 多表full join 数据丢失大坑
长方形表示各表id所属范围,t1可能有t2没有的id,同时t2也有可能有t1没有的id,当t1、t2两者full join on t1.id=t2.id 后,若再要对t3表进行full join可以,但是join条件为on t2.id=t3.id,或者说是on t1.id=t3.id的时候都会出现一个错误,因为如果单单用任意一个表的id对t3.id进行等值连接,则会缺少另一个表的等值连接条件,举例如果用t2.id=t3.id进行等值连接,则会出现以下情况。上位跑路同事留下来的坑。
2024-03-28 15:32:13
895
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人