hive表集群间的迁移

记录下工作中由于需要复制生产环境到测试环境以供测试使用做的一次数据库的迁移,方法比较繁琐,有待改进;

基本思路:将生产环境的表导出到hdfs,将hdfs的数据get到本地,scp到测试环境的本地,put到测试环境的hdfs,再进行导入;

  1. hive表到处到hdfs:
    export table table_name to '/home/path';

    这里表名最好将库名也加上,后面的path使用hdfs的路径

  2. get到本地:

    hadoop fs -get /home/get/table_name /localpath

    到本地目录,建议数据量不要太大,可以进行一个部分数据转移即可毕竟测试

  3. scp到测试环境

    scp /local_path/table_name test-cdh:/test_path

    这里可能需要好长时间,受网络带宽限制

  4. put到测试环境的hdfs

    hadoop fs -put /test_path/table_name /test_hdfs_path
    

    一下就是测试环境的逆向操作了

  5. import表数据到hive

    import table table_name from '/test_hdfs_path/table_name';

    搞定

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值