Hive四种表的应用:
1.内部表:
Hive默认创建的表类型为内部表
特点:
当表定义被删除的时候(如:drop table stu),表中的数据一并被删除(HDFS数据目录,源数据库表文件一并被删除);
使用场景:
多用来存储一些非业务类型数据,如:各省及对应区号表,全球每个国家及对应代码表。
而每天收集的业务数据尽量不要定义成内部表,这样即使表删除了,数据还在。
创建内部表,并加载数据:
create table order2 (id int,name string,value float) row format delimited fields terminated by ‘,’;
insert into order2(id,name,value) values (1,“xiaoming”,10000);//命令行插入
load data local inpath ‘/opt/mysoft/su.txt’ into table order2;//加载本地文件
load data inpath ‘hdfs://qiku1:9000/yjy’ into table order2;//加载HDFS文件到表中(系统自动删除了原有的HDFS文件)
2.外部表:
外部表只是对HDFS上相应文件的一个引用,仅此而已,当删除表定义的时候(drop table stu),表中的数据依然存在(HDFS数据目