一、LOCATION字段
1.适用的场景(多使用在外部表的场景下)
当数据已经存在hdfs上,并且不能随意移动这个数据,这个数据也不能被修改想使用这个数据的时候,只能指定location,建表的时候也可以使用location
2.例子
(1)创建数据库,通过location,指定在hdfs的路径。
这样数据库存储位置就是'/locate',而非默认的'/user/hive/warehouse'
create database if not exists db01_loc LOCATION '/locate';
创建测试表,查看路径
create table db01_loc.tb01(
name string
)
row format delimited fields terminated by'\t';
(2)创建表,通过location,指定在hdfs的路径
create table db01_loc.tb01(
name string
)
row format delimited fields terminated by'\t'
location '/tb01';
(3)注意:
这个字段的适用场景是:数据已经存在HDFS上不能移动位置了,那么就通过这个字段让表可以直接读到这份数据。另外,要注意建表的时候,应该让表变成外部表。
二、删除drop
1、删除空的DB
drop database db01_loc;
2、删除非空的DB
drop database db01_loc CASCADE;
3、清空表数据和删除表操作
(1)新建测试数据
create table stu_info(
num int,
name string
)
row format delimited fields terminated by'\t';
load data local inpath '/opt/datas/student.txt' into table stu_info;
(2)只是清空表里面的数据
TRUNCATE TABLE stu_info;
(3)删除了所有的表信息(元数据信息)
drop table if exists stu_info;
(4)重复加载数据的操作:
其实就是上传到hdfs多份数据,然后同名的数据文件会被重命名
load data local inpath '/opt/datas/student.txt' into table stu_info;