Hive数据的数据存储

Hive建表后,表的元数据存储在关系型数据库中(如:mysql),表的数据(内容)存储在hdfs中,这些数据是以文本的形式存储在hdfs中(关系型数据库是以二进制形式存储的),既然是存储在hdfs上,那么这些数据本身也是有元数据的(在NameNode中),而数据在DataNode中。这里注意两个元数据的不同。
如下图,建表并导入数据:
这里写图片描述
这里写图片描述
之后在mysql中会发现:
这里写图片描述
有一个hive_remote数据库,这里存储的就是hive中表的元数据,比如查看其中一个字段:
这里写图片描述
再去查看hdfs中的变化:
这里写图片描述
如图,在/user/hive_remote/warehouse/目录下会出现person目录,这就是我们在hive中创建的表,person目录里有一个dt-2018-1-1目录,这个目录里就是我们导入的数据。就是说,这里是按照一个分区一个目录的方式存放的。
再来看我们在hive中的配置文件hive-site.xml:
这里写图片描述
会发现/user/hive_remote/warehouse/这个目录是我们自己配置的路径(hdfs中的路径,不是本地路径)。
OK,这就是Hive数据的存储方式。

  • 6
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值