使用cloudera impala sql 进行交集、并集、差集查询

本文详细介绍了如何利用Cloudera Impala的SQL语法进行数据集合操作,包括如何执行交集、并集和差集查询,帮助用户更高效地处理大数据分析任务。
摘要由CSDN通过智能技术生成
impala-shell -i hadoop3 -f join_test.sql


Starting Impala Shell without Kerberos authentication
Connected to hadoop3:21000
Server version: impalad version 1.2.4 RELEASE (build ac29ae09d66c1244fe2ceb293083723226e66c1a)


use db02
show tables
+------+
| name |
+------+
| d1   |
| d2   |
+------+
Returned 2 row(s) in 0.01s


select * from d1
+-----------+-----+---------+
| username  | age | is_male |
+-----------+-----+---------+
| zhangshan | 23  | 1       |
| lisiiiii  | 24  | 1       |
| wangmazi  | 30  | 1       |
| meinvvvv  | 18  | 0       |
| damaaaaa  | 55  | 0       |
+-----------+-----+---------+
Returned 5 row(s) in 0.19s


select * from d2
+-----+---------+
| age | options |
+-----+---------+
| 1   | a       |
| 23  | bb      |
| 50  | ccc     |
| 30  | dddd    |
| 66  | eeeee   |
+-----+---------+
Returned 5 row(s) in 0.16s


#交集
select * from d1 a inner join d2 b on a.age=b.age
+-----------+-----+---------+-----+---------+
| username  | age | is_male | age | options |
+-----------+-----+---------+-----+---------+
| zhangshan | 23  | 1       | 23  | bb      |
| wangmazi  | 30  | 1       | 30  | dddd    |
+-----------+-----+---------+-----+---------+
Returned 2 row(s) in 0.29s


#多个条件下的交集
select * from d1 a inner join d2 b on a.age=b.age and a.username in ('zhangshan','lisiiiii','meinvvvv') and b.options in ('bb','ccc')
+-----------+-----+---------+-----+---------+
| username  | age | is_male | age | options |
+
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值