总体来说hiveSQL与SQL基本上一致,最初的设计目的就是为了让会SQL但是不会编程MapReduce的人也能使用Hadoop进行数据处理。
1. Hive不支持等值连接
例如:
SQL中内关联可以这样写: select * from a , b where a.key = b.key
Hive中应该这样写: select * from a join b on a.key = b.key
hive中不能使用省去join的写法。
2.分号字符
分号是sql语句的结束符号,在hive中也是,但是hive对分号的识别没有那么智能,有时需要进行转义 “;” --> “\073”
3.NULL
sql中null代表空值,但是在Hive中,String类型的字段若是空(empty)字符串,即长度为0,那么对它 is null 判断结果为False
4.Hive不支持将数据插入现有的表或分区中
Hive仅支持覆盖重写整个表。
insert overwrite 表 (重写覆盖)
5.Hive不支持 Insert into 表 Values(), UPDATA , DELETE 操作
insert into 就是往表或者分区中追加数据。
6.Hive支持嵌入mapreduce程序,来处理复杂的逻辑
暂时没有例子可以提供。
7.Hive支持将转换后的数据直接写入不同的表,还能写入分区,hdfs和本地目录
避免多次扫描输入表的开销。
(暂无例子提供)
★暂时整理这些,本人小白起步,若发现文中有不合适之处,请联系我改正!您的帮助会是我成长的阶梯!