Hive中的表类型

本文详细介绍了Hive中的四种表类型:内部表、外部表、分区表和分桶表。内部表是Hive的基本表结构,删除时会连同数据一起删除;外部表管理已存在于HDFS的数据,删除时不删除数据。分区表用于数据分类,提高查询效率;分桶表基于特定字段进行哈希抽样,方便数据采样。
摘要由CSDN通过智能技术生成

内部表和外部表

内部表

概念:内部表是Hive中最基本也是最简单的表结构。所谓内部表就是直接在Hive中创建的表,并手动向其中添加数据。
案例:
建立一张表名为my_internal的内部表:

create table my_internal(id int , name string);

内部表创建时,将在HDFS的/user/hive/warehouse/下创建同名文件夹:
在这里插入图片描述
注意:

  1. 如果在Hive中删除内部表,HDFS相应的文件夹也会被一同删除。

外部表

概念:在Hive中创建表管理HDFS中已经存在的数据。
案例:
在我的HDFS上/hivetest/score/目录下有一个score.txt 的文件,里面记录了学生的考试成绩:
在这里插入图片描述
建表语句:

create external table score(name string,chinese string,math string,english string) row format delimited fields terminated by ' ' location '/hivetest/score
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值