对表进行操作
把别的表的部分或全部字段及其内容提取出来,创建成一个新的表.
create table emp2 as select empno,ename,job from emp;
create table emp3 like emp; 复制表结构 like关键字,不会复制数据
insert导入,跟上面创建表直接导入数据的意思一样.只不过这个得表提前存在.
追加-append-默认方式
insert into table 表名 select * from track_log;
例如:insert into table emp2 select empno,ename,job from emp;
覆盖-overwrite-显示指定-使用频率高
insert overwrite table 表名 select * from track_log;
导入数据
在hdfs上操作只要把local去掉就可以了.
本地导入: 多次执行这个操作值会拼接进去,不会覆盖,会越来越多.
load data local inpath 'emp.txt文件位置' into table 表名称 ;
覆盖导入:会把本次导入的数据全部覆盖掉原有的数据.
load data local inpath 'path/file' overwrite into table 表名称 ;
导出表数据
Hive表导出数据方式,输出路径不要写文件名称,写输出到哪个文件夹下就可以了.不能自定义名字的.如果这个文件夹不存在的话,它会自己递归创建的.
本地导出
例如:insert overwrite local directory "/opt/modules/hive-0.13.1-cdh5.3.6/outputdata/" row format delimited fields terminated by '\t' select * from emp ;
HDFS导出,把local去掉即可
例如:insert overwrite diretory "path/" select * from staff;
覆盖追加导出,一个>是覆盖,两个>>是追加.直接通过命令就可以导出到指定的文件里,不需要进入hive
bin/hive -e "select empno,ename,job from db_hive_demo.emp;" >> /opt/modules/hive-0.13.1-cdh5.3.6/outputdata/2.txt
bin/hive -e "select empno,ename,job from db_hive_demo.emp;" > /opt/modules/hive-0.13.1-cdh5.3.6/outputdata/2.txt