hive 内部表和外部表的区别
-
内部表没有external 关键字
-
内部表可以不指定 location关键字,当然hivesql执行外部表是也可以不指定,但是一般不这么用,sparksql,执行时不指定会报错
-
内部表删除表时,直接删除元数据以及实际数据,外部表则只会删除元数据,hdfs上保留数据,
这一条会衍生一些东西
- 如果建立临时表,一般使用内部表,这样可以直接删除数据,不至于导致数据多余
- 删除外部表时,再create table ,然后insert overwrite 时,会使数据重复一倍,需要注意,这时候需要再insert overwrite一次,
- 外部表数据是hdfs控制,更加安全
-
由于外部表的路径可以指定,不会跑到默认的/user/hive/warehouse下面去,所以权限更加好控制