【Hadoop】使用Hadoop Shell 命令导数据

场景:两个大数据集群,需要从生产上面拉一批原始的数据放到测试集群进行分析,两个环境的表结构相同,都是内部表

1、使用hadoop 的rm 命令清空表的原来的少量数据

# 删除数据
hdfs dfs -rm -f -r -skipTrash  hdfs://node1/apps/hive/warehosue/ods.db/table_name/

PS:如果不加-skipTrash,删除的目录会放入/user/hdfs/.Trash中。有专门的配置项来指定什么时候清空回收站
2、用distcp 命令把生产的数据拷贝过来

#用于集群内部或者集群之间拷贝数据的常用命令
hadoop distcp -pb -m 10 hdfs://cluster/apps/hive/warehosue/ods.db/table_name hdfs:node_cluster/apps/hive/warehouse/ods.db/table_name

3、处理一下目标表

hive -e "analyze table table_name compute statistics;"

如果是分区表

hive -e "msck repair table table_name;"

二、get、load

1、获取表数据
数据会从hdfs 到 本地

hdfs dfs -get /apps/hive/warehouse/ods.db/table_name/*  /data_swap/

把数据放入到另一个 集群的机器
2、Hive的load命令导入到表中

hive -e "load data local inpath /data_swap/* into table ods.table_name;"

load 的时候注意一下文件的格式

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值