hive的外部表和内部表,以及其文件目录关系
共同点:建表时若指定location位置,则导入的文件(该文件在hdfs上)都会剪切到location相应的位 置,如果该文件是linux上的,只是复制一份放在location位置。
建表时未指定位置,则放入默认的warehouse里当前建表的数据库文件下 : /user/hive/warehouse/ad_hive.db(ad_hive.db为当前建表时的数据库)
不同点:内部表drop时会删除表名文件及该目录下的数据子文件
外部表drop时不会删除表文件目录,当在此创建同名的表时,虽然以前的同名目录与该表重名,但是直接查数据是查不出来的,但是如果再往该表里插入数据,再查会一并查出之前文件的数据以及刚插入的数据。
既然内部表无法删除表数据只能删除表结构的元数据所以也无法使用:truncate table 表名;
内部表切换成外部表:alter table student2 set tblproperties(‘EXTERNAL’=‘TRUE’);
外部表切换成内部表:alter table student2 set tblproperties(‘EXTERNAL’=‘FALSE’);