Hive存储原理,数据库/表基本操作

本文介绍了Hive的数据存储原理,数据分为HDFS上的数据文件和元数据,元数据通常存储在MySQL中。Hive的数据模型包括内部表、外部表、分区和桶。内部表和外部表的主要区别在于数据存储位置和删除操作的影响。此外,文章还简要提到了启动Hive和DDL语句,如Database和Table的创建。
摘要由CSDN通过智能技术生成

官方文档:https://cwiki.apache.org/confluence/display/Hive/LanguageManual

一 数据存储

Hive 数据分两部分:一部分是真实的数据文件,存放在hdfs上;另一份是真实数据的元数据(即数据的描述信息,比如说存储位置、时间、大小等),存储在关系型数据库中(如:mysql),存放的配置可以修改hive-site.xml来完成

只需要在创建表的时候告诉 Hive 数据中的列分隔符和行分隔符,Hive 就可以解析数据

Hive 数据模型包括:内部表(Table)、外部表(External Table)、分区(Partition)、桶(Bucket)
参考链接:https://www.jianshu.com/p/297adbdba7f4
① Table:在hdfs中表现所属db目录下一个文件
② External table:外部表, 与table类似,不过其数据存放位置可以在任意指定路径
③ Partition:在hdfs中表现为table目录下的子目录
④ Bucket:在hdfs中表现为同一个表目录下根据hash散列之后的多个文件, 会根据不同的文件把数据放到不同的文件中

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值