HIVE学习笔记----数据存储

本文详细介绍了Hive中的四种表类型:内部表、分区表、外部表和桶表。内部表与数据库中的Table类似,其数据存储在特定目录下;分区表通过partition实现对表数据的进一步组织;外部表用于指向已存在于HDFS中的数据;桶表则利用哈希函数对数据进行分布存储。
摘要由CSDN通过智能技术生成

  -基于HDFS

  -没有专门的数据存储格式

  -存储结构主要包括:数据库、文件、表、视图

  -可以直接加载文本文件(txt  csv等)

  -创建表时,指定Hive数据的列分隔符与行分隔符

 

表: 内部表 /分区表 /外部表 /桶表

  -内部表:与数据库中的Tale在概念上类似;

                 每一个Table在hive中都有一个相应的目录存储数据;

                 所有的Table数据不包括外部表都保存在这个目录中;

                 删除表时, 元数据与数据都会被删除;

create table table_name ( ,  , ,) location  '/mytable/hive/t2';  ----指定表文件保存目录

create table table_name ( ,  , ,) row format delimited fields terminated by ',';  ----指定列与列之间的分隔符

 

   -分区表:partition对应于数据库的partition列的密集索引

                   一个分区对应于表中的一个目录

                   所有的分区数据都存储在对应的目录中

   

   -外部表:指向已经在HDFS中存在的数据,可以创建分区

                   只有一个过程,加载数据和创建表同时完成,并不会移动到数据仓库目录中,只是与外部数据建议一个链接,当删除外部表时,仅删除该链接

 

 -桶表:对数据进行哈希取值

                   

  

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值