Hive四种表的应用

本文介绍了Hive中的四种表类型:内部表、外部表、分区表和桶表。内部表在删除时会连同数据一起删除,适合存储非业务数据;外部表仅删除表定义,数据保留,适合业务数据。分区表通过分区字段提高查询效率,桶表则通过数据哈希分桶用于数据抽查。在实际应用中,通常使用外部表存储业务数据,桶表用于数据抽样。插入桶表数据前需开启数据分桶开关。
摘要由CSDN通过智能技术生成

Hive四种表的应用:

1.内部表:
Hive默认创建的表类型为内部表

特点:
当表定义被删除的时候(如:drop table stu),表中的数据一并被删除(HDFS数据目录,源数据库表文件一并被删除);

使用场景:
多用来存储一些非业务类型数据,如:各省及对应区号表,全球每个国家及对应代码表。
而每天收集的业务数据尽量不要定义成内部表,这样即使表删除了,数据还在。

创建内部表,并加载数据:
create table order2 (id int,name string,value float) row format delimited fields terminated by ‘,’;

insert into order2(id,name,value) values (1,“xiaoming”,10000);//命令行插入

load data local inpath ‘/opt/mysoft/su.txt’ into table order2;//加载本地文件

load data inpath ‘hdfs://qiku1:9000/yjy’ into table order2;//加载HDFS文件到表中(系统自动删除了原有的HDFS文件)

2.外部表:
外部表只是对HDFS上相应文件的一个引用,仅此而已,当删除表定义的时候(drop table stu),表中的数据依然存在(HDFS数据目

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值