CDH开启sentry后如何同步跨集群hive数据迁移

本文介绍了在CDH环境下,开启Sentry后如何进行跨集群的Hive数据迁移。首先,通过设置ACL权限允许新集群的hadoop用户访问源集群的HDFS目录。然后,使用distcp命令复制数据,接着在新集群上创建外部表并指定存储位置。最后,加载数据到新表并验证数据迁移成功。
摘要由CSDN通过智能技术生成

1.        不同集群直接hive迁移

由于集群里设置了dfs.permissions=true  的 因此hdfs上的文件访问须hdfs用户才可以操作 被迁移的集群是hadoop用户,因此先对现有的目录设在acl权限访问/hive

①   新集群操作

导数据之先把另一个集群的hadoop用户授予本集群的hdfs访问权限。

hdfs dfs -setfacl -R -muser:hadoop:rwx /hive

 

②   原有集群里面执行

hadoop@hdp01:~$ hadoopdistcp /hive/warehouse/proc.db/drug_info_result3.txthdfs://10.3.14.24:8020/hive/warehouse/proc.db/

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值