S4cmd 安装及使用教程
s4cmdSuper S3 command line tool项目地址:https://gitcode.com/gh_mirrors/s4/s4cmd
1. 项目介绍
S4cmd 是一个基于 Python 的轻量级命令行工具,用于高效地管理和操作 Amazon S3 存储服务。它是对 s3cmd 的替代品,设计时考虑了性能提升和大型文件处理,同时还提供了一些额外的功能和修复。S4cmd 采用多线程多连接实现以增强性能,并努力保持与 s3cmd 常见使用场景的兼容性,尽管在某些特定情况下行为可能会有所不同。
主要特点包括:
- 简洁的代码(少于 1500 行)
- 基于广泛使用的 Boto3 库
- 支持多线程/多连接以提高性能
- 支持
ls
,put
,get
,cp
,mv
,sync
,del
,du
等常规操作 - 能正确处理符号链接
- 支持
s3://
和s3n://
前缀 - 提供
dsync
命令代替旧版基于get/put/mv
的sync
2. 项目快速启动
安装
首先确保你的系统已经安装了 Python 3.6 及以上版本。可以通过以下命令安装 S4cmd:
pip install s4cmd
配置认证
如果你已经有配置过 s3cmd 的 ~/.s3cfg
文件,S4cmd 将自动使用这些凭证。否则,你可以通过设置环境变量来指定你的 AWS 凭证:
export S3_ACCESS_KEY=<your_access_key>
export S3_SECRET_KEY=<your_secret_key>
或者,在没有提供 AWS 凭证但运行在 EC2 实例上时,它会尝试自动使用关联的 IAM 角色。
使用示例
列出 S3 存储桶的内容:
s4cmd ls s3://<your_bucket_name>
上传文件到 S3:
s4cmd put /local/file.txt s3://<your_bucket_name>/file.txt
下载 S3 上的文件:
s4cmd get s3://<your_bucket_name>/file.txt /local/
同步本地目录至 S3:
s4cmd sync /local/directory s3://<your_bucket_name>/directory --recursive --force --sync-check
3. 应用案例和最佳实践
- 在数据备份方案中,可以定期使用
sync
命令同步本地重要文件夹至 S3。 - 对于大量小文件的迁移,利用多线程可以显著缩短传输时间。
- 配合
--delete-removed
参数,同步过程中可以删除目标位置已不存在的文件,确保两边一致性。
4. 典型生态项目
S4cmd 支持 S3 兼容的服务,如 DreamHost 和 Cloudian,可以通过 --endpoint-url
设置自定义端点。这使得 S4cmd 可以用于与各种云存储提供商进行交互。
此外,Boto3 库是 S4cmd 的基础,是 AWS SDK for Python,它提供了与许多其他 AWS 服务的接口,使得扩展 S4cmd 或与其他 AWS 功能集成成为可能。
希望这个教程能帮助您更好地理解和使用 S4cmd。更多信息和详细的命令选项,建议参考 S4cmd 的官方 GitHub 页面。
s4cmdSuper S3 command line tool项目地址:https://gitcode.com/gh_mirrors/s4/s4cmd