1、 Hive不允许直接访问非group by字段
解决办法(1)
-- 对于非group by字段,可以用Hive的collect_set()、collect_list()函数收集这些字段,返回一个数组,collect_set()对元素进行去重操作,collect_list()不对元素去重;
-- 使用数字下标,可以直接访问数组中的元素;
例如:
对于表
执行语句select s_id,collect_set(s_score) from score group by s_id;后的结果为:
当我们想直接从数组获取第一个元素时:在collect_set(s_score)后加入下标即可
select s_id,collect_set(s_score)[0] from score group by s_id;
(2)在group by 后面加上所查询的字段
2、在hive 中在as后面要用``
3、关于null
(1)
coalesce()返回表达式中的第一个非空表达式的值
如果所有的表达式均为空则返回null
eg1:coalesce(表达式1,表达式2);
eg2:coalesce(表达式1,表达式2,表达式3...);
(2)
nvl(expr1,expr2)
作⽤:将查询为Null值转换为指定值。
若expr1为Null,则返回expr2,否则返回expr1。
select nvl(count,2);
(3)
if(条件表达式,满足true执行,满足false执行)
select if(a is nul,'true','false');
select if(a is nul,'true','false');