一、定义
hive计算中NULL表示的是异常(当结果为空值、或计算错误情况会出现)。
''表示是字段不为null空值,是字符串格式。
二、存储方法
1、hive中NULL的默认存储方式是’\N’。
2、如果表中存在大量的NULL值,则在Hive的数据文件中会产生大量的\N数据,浪费存储空间。
3、可以使用serialization.null.format设置NULL的存储方式,可以设置为默认的’\N’,也可以为NULL或’’
alter table test_null set serdeproperties('serialization.null.format' = '')
三、查询方法
调用hive中默认的存储方式,当table_a数据如下时:
id name
1 \N
2
select