1、建表语句
1.1 内部表
平时创建的普通表为内部表
create table `test_internal` (
id string comment 'ID',
name string comment '名字'
)
comment '测试内部表'
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;
外部表
带external关键字的为外部表
create external table `test_external` (
id string comment 'ID',
name string comment '名字'
)
comment '测试外部表'
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;
仅从建表语句上看,内部表和外部表的区别为是否带有external关键字。
2、location
网上很多博客写的外部表建表语句中都带有location关键字,我这里单独分开来写。
其实不管是内部表还是外部表都可以加location关键字指定hive表的存储路径,当然也可以不加,从这点看是没有区别的。
如果不加location那么不管是内部表还是外部表都会在默认的hive配置的hdfs路径下下新建一个和表名相同的文件夹。
如果加了location指定另外的文件夹,那么在查询时,该文件夹下对应的数据会加载到hive表里。
示例:
2.1 数据
data.txt
002,李四
003,王五
hadoop fs -mkdir -p /tmp/dkl/internal