之前学了数据库,所以掌握hive还是比较容易的。hive可以看做第二个SQL,但是有些东西存在差别
1、join
left outer join
right outer join
要不然,null空值行会无法显示
2、order by ; sort by;distribute by; cluster by
使用order by会引发全局排序
使用distribute和sort进行分组排序
http://t.csdn.cn/Zqyef
group by 分组报错
为啥定义一个别名就可?
hive order by 后跟 别名,HIve只能用聚合函数的别名排序,不可以用聚合函数的表达式排序
数据类型转换