In的实现:
Hive中的in的实现方式很多,简单说几种:
- 用left semi join实现
- 用left outer join+is not null实现
- Inner join实现
Not in的实现:
Left outer join+is null
举例说明:
有两个表如下:
skim表
userID | itemID | time |
001 | 342 | 2015-05-08 |
002 | 382 | 2015-05-09 |
002 | 458 | 2015-05-09 |
004 | 325 | 2015-05-09 |