使用load导入文件数据却导致文件消失
在使用hive
时,使用load
导入外部文件的数据,却发现原文件消失了,经过一番仔细查找,发现文件出现在了hive
创建的工作目录下的表里
问:我们该如何避免文件因为导入数据而使其位置发生移动?
答:我们可以在创建表时(只限于外部表)指定目录,这样就可以避免文件的移动
create table test (id int,name string)
row format delimited
fields terminated by ','
location '/test'
这样还有一个好处就是,可以不要导入数据,直接使用select
语句就可以查询
内部表(也就是默认创建的表)在删除表时,会将元数据和数据文件一起删除,但是外部表只会删除元数据,数据文件是不会删除的
若不小心删除了表,该如何恢复元数据呢?
- 第一步:创建一个新的表
- 第二步:使用下列命令即可
msck repair table po_weibo_comment_data;