向Hive表中装载数据
Hive不会验证向表中装载的数据和表的模式是否匹配(需要自己检查确认),但是会检查文件的格式是否和表结构定义的一致(创建表时指定的结构若为SEQUENCEFILE,则装载进去的文件也应该为sequencefile格式)。
从本地文件系统向表中装载数据
LOAD DATA LOCAL INPATH 'path' INTO TABLE 'table'
从本地文件系统向表中装载数据,使用overwrite覆盖原表数据
LOAD DATA LOCAL INPATH 'path' OVERWRITE INTO TABLE 'table'
从本地文件系统向表中装载数据,使用overwrite覆盖原表数据并指定时间分区
LOAD DATA LOCAL INPATH 'path' OVERWRITE INTO TABLE 'table' PARTITION (dt='2019-11-11')
从HDFS向表中装载数据
LOAD DATA INPATH 'path' INTO TABLE 'table'
从HDFS向表中装载数据,使用overwrite覆盖原表数据
LOAD DATA INPATH 'path' OVERWRITE INTO TABLE 'table'
从HDFS向表中装载数据,使用overwrite覆盖原表数据并指定时间分区
LOAD DATA LOCAL INPATH &

本文介绍了Hive的基础操作,包括向Hive表中装载数据(覆盖原表数据、指定时间分区、从HDFS装载),动态分区插入,导出数据,引用集合类型元素的方法,解决上溢和下溢问题的策略,数据类型转换函数,避免MR任务的情况,Hive的join优化,order by和sort by的区别,以及distribute by和cluster by的使用场景。
最低0.47元/天 解锁文章
6547

被折叠的 条评论
为什么被折叠?



