1.数据库判空函数:
(1)MySQL里有ifnull函数:ifnull(第1个参数,第2个参数):如果第1个参数不是null,则返回第1个参数,否则就返回第二个参数;
(2)Hive没有MySQL的IFNULL函数,可以用if()函数替代:
在hive里: if(条件,值1,值2),条件为真,返回值1,否则返回值2;相当于三目运算符;
2.hive中count(*)、count(1)、count(某字段)的区别:
count(*):对所有行进行统计,包括NULL行,就是总的行数。
count(1):所有行进行统计,包括NULL行,也是总的行数,但是比count(*)更快用时更少。
count(column):对column中非Null进行统计,也就是统计的是非空总行数。
3.inner join、left join:
inner join就是取各个表条件的交集,left join就是以左边的表为主;
4.in(值1,值2):就是取并集,id in(2,3)就是id取值为2或者3;
5.count():
举个栗子:
select * from student s where s_id in(
select s_id from score where c_id in(1,2) group by s_id having count(1) = 2
,); count(1) = 2意思就是c_id=1,并且,c_id=2,通过count(1) = 2就排除了c_id只=1,或者c_id只=2的情况;