Hive入门之基础知识(二)之数据操作与查询

本文介绍了Hive的基础操作,包括向Hive表中装载数据(覆盖原表数据、指定时间分区、从HDFS装载),动态分区插入,导出数据,引用集合类型元素的方法,解决上溢和下溢问题的策略,数据类型转换函数,避免MR任务的情况,Hive的join优化,order by和sort by的区别,以及distribute by和cluster by的使用场景。
摘要由CSDN通过智能技术生成

向Hive表中装载数据

Hive不会验证向表中装载的数据和表的模式是否匹配(需要自己检查确认),但是会检查文件的格式是否和表结构定义的一致(创建表时指定的结构若为SEQUENCEFILE,则装载进去的文件也应该为sequencefile格式)。

从本地文件系统向表中装载数据

LOAD DATA LOCAL INPATH 'path' INTO TABLE 'table'  

从本地文件系统向表中装载数据,使用overwrite覆盖原表数据

LOAD DATA LOCAL INPATH 'path' OVERWRITE INTO TABLE 'table'

从本地文件系统向表中装载数据,使用overwrite覆盖原表数据并指定时间分区

LOAD DATA LOCAL INPATH 'path' OVERWRITE INTO TABLE 'table' PARTITION (dt='2019-11-11')

从HDFS向表中装载数据

LOAD DATA INPATH 'path' INTO TABLE 'table'  

从HDFS向表中装载数据,使用overwrite覆盖原表数据

LOAD DATA INPATH 'path' OVERWRITE INTO TABLE 'table'

从HDFS向表中装载数据,使用overwrite覆盖原表数据并指定时间分区

LOAD DATA LOCAL INPATH &
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值