hive中导出数据主要分为两大类,分别是导出数据到linux系统和导出数据到hdfs文件系统。
另外也可以认为导出数据到其他hive表也算导出数据(不过该方式也是导入数据)
命令如下:
insert overwrite [local] directory directory1 [row format row_format][stored as file_format] select ...from...
注意:
hive导出数据支持一次导出到多个文件夹中,同多表同时导入数据一样。
导出表关联后的班级名称和学生名称(Local&hdfs).(导出全部部位空的信息
from (select classes.classname as col1, students.studentname as col2 from classes join students on classes.classid = students.classid) as tmp insert overwrite local directory '/home/hadoop/result/13/01' select col1, col2 insert overwrite directory 'user/result/13/01' format delimited fields terminated by ',' select col1, col2 row ;
union:进行数据合并,格式为:
select1 union all select2 ... union all selectn
explain: hql执行计划查询。格式为:explain hql
hive -e "hql":在linux系统中执行hive语句
hive -f "filepath":执行linux系统中的包含hive语句的文件
view: hive支持视图的使用,单只支持逻辑视图,不支持物理视图。使用语法和table类型,创建语法为:create view viewname as select_statement
View Odds and Ends