hadoop命令distcp注意事项

    hadoop  distcp命令用于在两个不同的集群间拷贝数据,它的优点在于将数据拷贝操作作为mapred程序来执行,这样就大大提高了拷贝的速度,使用distcp命令时必须注意以下事项:

   1)数据源集群 的所有节点必须 知道目标集群所有节点ip和host的转换关系

   2)目标路径必须存在

   3)命令中必须使用主机名,而不是ip地址

   测试结果如下:

bin/hadoop distcp hdfs://hadoopmaster:9000/data/dw/vv/20111208/vv_20111208_05_part-00000.lzo hdfs://hadoopmaster2:9000/user/rsync/test1
11/12/08 17:23:43 INFO tools.DistCp: srcPaths=[hdfs://hadoopmaster:9000/data/dw/vv/20111208/vv_20111208_05_part-00000.lzo]
11/12/08 17:23:43 INFO tools.DistCp: destPath=hdfs://hadoopmaster2:9000/user/rsync/test1
11/12/08 17:23:44 INFO tools.DistCp: sourcePathsCount=1
11/12/08 17:23:44 INFO tools.DistCp: filesToCopyCount=1
11/12/08 17:23:44 INFO tools.DistCp: bytesToCopyCount=30.2m
11/12/08 17:23:45 INFO mapred.JobClient: Running job: job_201112081643_0027
11/12/08 17:23:46 INFO mapred.JobClient:  map 0% reduce 0%
11/12/08 17:24:08 INFO mapred.JobClient:  map 100% reduce 0%
11/12/08 17:24:13 INFO mapred.JobClient: Job complete: job_201112081643_0027
11/12/08 17:24:13 INFO mapred.JobClient: Counters: 18
11/12/08 17:24:13 INFO mapred.JobClient:   Job Counters 
11/12/08 17:24:13 INFO mapred.JobClient:     SLOTS_MILLIS_MAPS=16764
11/12/08 17:24:13 INFO mapred.JobClient:     Total time spent by all reduces waiting after reserving slots (ms)=0
11/12/08 17:24:13 INFO mapred.JobClient:     Total time spent by all maps waiting after reserving slots (ms)=0
11/12/08 17:24:13 INFO mapred.JobClient:     Launched map tasks=1
11/12/08 17:24:13 INFO mapred.JobClient:     SLOTS_MILLIS_REDUCES=0
11/12/08 17:24:13 INFO mapred.JobClient:   File Input Format Counters 
11/12/08 17:24:13 INFO mapred.JobClient:     Bytes Read=270
11/12/08 17:24:13 INFO mapred.JobClient:   File Output Format Counters 
11/12/08 17:24:13 INFO mapred.JobClient:     Bytes Written=0
11/12/08 17:24:13 INFO mapred.JobClient:   FileSystemCounters
11/12/08 17:24:13 INFO mapred.JobClient:     HDFS_BYTES_READ=31682544
11/12/08 17:24:13 INFO mapred.JobClient:     FILE_BYTES_WRITTEN=22361
11/12/08 17:24:13 INFO mapred.JobClient:     HDFS_BYTES_WRITTEN=31682124
11/12/08 17:24:13 INFO mapred.JobClient:   distcp
11/12/08 17:24:13 INFO mapred.JobClient:     Files copied=1
11/12/08 17:24:13 INFO mapred.JobClient:     Bytes copied=31682124
11/12/08 17:24:13 INFO mapred.JobClient:     Bytes expected=31682124
11/12/08 17:24:13 INFO mapred.JobClient:   Map-Reduce Framework
11/12/08 17:24:13 INFO mapred.JobClient:     Map input records=1
11/12/08 17:24:13 INFO mapred.JobClient:     Spilled Records=0
11/12/08 17:24:13 INFO mapred.JobClient:     Map input bytes=170
11/12/08 17:24:13 INFO mapred.JobClient:     Map output records=0
11/12/08 17:24:13 INFO mapred.JobClient:     SPLIT_RAW_BYTES=150



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值