hive语法尝试及结论

这篇博客总结了Hive的使用经验,包括多插入模式的限制、查询不显示列头、数据覆盖、表结构复制、不同版本的查询支持如in、having操作,以及exists和嵌套查询等。还提到了数据分隔符、日期格式、数据加载时的注意事项,以及内外部表的管理。最后指出在处理字符串和分区时应注意的细节。
摘要由CSDN通过智能技术生成
特别注意:要谨慎使用overwrite关键字,特别是它与目录结合的时候,路径不要搞错了,否则目录下的文件直接被覆盖了
hive> insert into area_t values('1','1','1',now(),'1','1',2,2);
NoViableAltException(26@[])
结论:不支持此种用法

hive> insert into table area_t select areacode,areaname,'1',gxrq,parentcode,bz,flags,flags1 from area limit 15;
结论:追加方式

hive> insert overwrite table area_t select areacode,areaname,'1',gxrq,parentcode,bz,flags,flags1 from area limit 15;
结论:覆盖的方式

hive> insert overwrite directory '/user/lifeng' select * from area;
结论:不能用into、目录要用引号包含

hive> from area
    > insert into table area_t select areacode,areaname,'1',gxrq,parentcode,bz,flags,flags1 limit 10;
结论:基本模式的用法

hive> from area
    > insert into table area_t select areacode,areaname,'1',gxrq,parentcode,bz,flags,flags1 limit 10
    > insert into table area_t select areacode,areaname,'1',gxrq,parentcode,bz,flags,flags1 order by areacode desc limit  15;
FAILED: SemanticException [Error 10087]: The same output cannot be present multiple times:  area_t

结论:使用多插入模式时,不能插入相同的表


所有查询都不会显示列头(即字段名)

hive> select [all] parentcode from area limit 20;

结论:查询所有记录

hive> select all parentcode from area order by parentcode limit 20;
结论:排序后再选取前面的20条记录,order by 全局排序,只有一个Reduce任务

hive> select all parentcode from area sort by p
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值