Hive删除库、表或表中部分数据总结

注:table_name为表名,database_name为库名

一、删除库

drop可用于删除库

drop database if exists database_name;

如果删除库中还存在表,上面代码会报错,Hive会提醒,将要执行删除操作的库里面还存在tables
解决这个错误有两种方法:
(1)将库中所有表先删除完,再删除库;
(2)使用cascade关键字执行强制删库。

drop database if exists database_name cascade;

二、删除表或表中的所有数据

drop也可用于删除库中的表
删除整个表

drop table table_name;

如果要永久性删除,不准备再恢复

drop table table_name purge;

truncate用于删除所有的行,仅删除表中数据,保留表结构

truncate table table_name; 

和下面代码是一样的效果

--代码中table_name 是同一个表
insert overwrite table table_name select * from table_name where 1=0;

delete 删除操作,用于删除特定行条件,也可以删除给定表中所有行
下面的删除操作会报错

delete from table_name where 1 = 1;   

(使用where 1=1 删除所有行,类似SQL中where 1 = 1 的使用)

三、分区表,删除分区或分区中部分数据

删除某个partition

alter table table_name drop partition(partiton_name='xxx')

删除某个partition中的部分数据
可以换一种思路,用INSERT OVERWRITE TABLE来操作,可以理解为用覆盖来删除,选出符合条件的数据结果,把对应的partition的信息重新写一遍。
通过WHERE来限定需要留下的信息,没有留下的信息就被删除了,即满足WHERE后面条件的数据是表中这个分区需要保留的数据。

--下边代码table_name 是同一个表
INSERT OVERWRITE TABLE table_name PARTITION(year='2018') 
SELECT * FROM table_name
WHERE year='2018' AND month>6;

四、非分区表,删除部分数据

类似可以用INSERT OVERWRITE TABLE来操作,可以理解为用覆盖来删除,选出符合条件的数据结果重新写表。
满足WHERE后面条件的数据是表table_name 中需要保留的数据,即删除这个表中2018年及以前的数据,保留2018年之后的数据。

--下边代码table_name 是同一个表
INSERT OVERWRITE TABLE table_name 
SELECT * FROM table_name 
WHERE year>2018;
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值