Hive中空值判断基本分两种,,一种是NULL与\N,一种是空字符串
1. NULL与\N
hive在底层数据中保存和标识NULL是由 alter table name SET SERDEPROPERTIES(‘serialization.null.format’ = ‘\N’); 参数控制的
(1)设置 alter table name SET SERDEPROPERTIES('serialization.null.format' = '\N');
则:底层数据保存的是’\N’,通过查询显示的是'NULL'
这时如果查询为空值的字段可通过 语句:a is null
或者 a='\\N'
(2)设置 alter tablename SET SERDEPROPERTIES('serialization.null.format' = 'NULL');
则:底层数据保存的是'NULL'
,通过查询显示的是'NULL'
这时如果查询为空值的字段可通过 语句:a is null
或者 a='NULL'
2. 空字符串
此时用 a is null
是无法查询这种值的,必须通过 a=''
或者 length(a)=0
查询 ,不等于可以用 a=<>''