数仓学习笔记_hive元数据管理

hive元数据管理

我们通常会使用MySQL管理hive的元数据,只要在hive-site.xml中写入库路径、连接驱动、用户名和密码即可。
但是在企业中,我们可以使用统一元数据管理:EMR
相较于MySQL,EMR有如下优点

  • EMR中的数据不会随着集群的释放而消失,所以可以实现元数据的持久化存储,但是需要注意的一点是在删除表之前,一定要确认元数据已经删除,否则会造成脏数据的产生
  • 第二个优点,可以实现计算存储分离,可以把数据放在阿里云的OSS上,节省了数据迁移问题的同时,也大大节省了集群成本,EMR集群只负责计算,计算后可直接释放,在OSS上实现存储
  • 可以实现多个EMR集群的资源共享,不必进行元数据的迁移和共享,所有的数据都存储在OSS,可以直接进行访问。
    但是要注意的是EMR-WEB端只能创建外部表和分区表。
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值