hive表加载数据
总结自己在hive表中常用的几种载入数据的方式
1. load data (常用)
load data inpath ‘/集群路径.txt’;
load data local inpath ‘/本地路径’;
2. select(偶尔用)
insert into table tablename1 select * from tablename2
3. insert(基本不用)
insert into table tablename (id,name) values (001,aaa);
insert overwrite table tablename (id,name) values (001,aaa);
4. alter(新学)
alter table tablename set location ‘/集群路径’;
这里重点提下第四个,与load data不同的是,alter载入的数据并不会被移入warehouse内,而是保持在源路径,内部表和外部表都如此。
但是删除内部表的时候,源数据会会一并删除,外部表则不会。
另外用第四种方式载入的数据,再用2、3方式则不可用了,暂时没明白为什么。