Linux 之间的文件传输方式

本文介绍了在大数据集群环境下进行文件拷贝和同步的几种方法,包括SCP和RSYNC。通过示例展示了如何在不同主机间使用SCP进行文件推送和拉取,以及如何利用RSYNC仅同步差异内容。此外,还提供了一个名为xsync的分发脚本,用于批量在集群中同步文件。
摘要由CSDN通过智能技术生成

解决方案

大数据集群经常涉及文件拷贝,我在学习大数据时总结了几种方式

三台主机:

192.168.10.100

192.168.10.101

192.168.10.102

有一个一样的用户:swcode

做过映射关系:

hadoop100	192.168.10.100
hadoop101	192.168.10.101
hadoop102	192.168.10.102

SCP拷贝

scp会拷贝所有指定内容

192.168.10.101推送数据

scp -r /home/swcode/test.txt test1@192.168.1.101:/home/swcode

192.168.10.100拉取数据

scp -r swcode@192.168.1.101:/home/swcode/test.txt /home/swcode/

192.168.10.101上将192.168.10.100的数据拷贝到192.168.10.102

scp -r swcode@192.168.1.100:/home/swcode/test.txt swcode@192.168.1.102:/home/swcode/

RSYNC同步

rsync只会复制不一样的内容

同步192.168.10.100192.168.10.101~目录

rsync -av /home/swcode/ swcode@192.168.10.101:/home/swcode

没有的可以安装

yum install -y rsync

分发脚本xsync,可以放到/etc/profile.d/中,全局使用(别忘了chomd执行权限)

#!/bin/bash

#1. 判断参数个数
if [ $# -lt 1 ]
then
    echo Not Enough Arguement!
    exit;
fi

#2. 遍历集群所有机器,hosts内做过映射关系:hadoop102	192.168.10.102
for host in hadoop101 hadoop102
do
    echo =============== $host ===============
    #3. 遍历所有目录,挨个发送
    for file in $@
    do 
        #4. 判断文件是否存在
        if [ -e $file ]
            then
                #5. 获取父目录
                pdir=$(cd -P $(dirname $file); pwd)
                #6. 获取当前文件的名称
                fname=$(basename $file)
                ssh $host "mkdir -p $pdir"
                rsync -av $pdir/$filename $host:$pdir
            else
                echo $file does not exists!
        fi
    done
done

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值