shell脚本批量上传数据到阿里云的odps

本文介绍了如何通过shell脚本将大量数据文件上传到阿里云的ODPS服务。首先,需要安装ODPS客户端并配置相关参数,如project_name、access_id等。然后,演示了单一文件上传的命令,包括-dbr和-mbr选项的用法以处理脏数据。最后,说明了如何编写shell脚本来实现批量文件上传。
摘要由CSDN通过智能技术生成

需求:将一个硬盘中的3000+个数据文件上传到odps上

1、安装odps客户端并进行相关的配置
配置文件在odpsclient/conf/odps_config.ini
project_name=
access_id=
access_key=
end_point=
tunnel_endpoint=
2、单一文件的上传
进入到客户端bin目录下,启动./odpscmd,然后运行如下命令;
tunnel upload 文件路径/文件 项目名.表名 -dbr true -mbr 100000 threads 10;

–dbr:是否忽略脏数据(多列,少列,列数据类型不匹配等情况)。 值为 true 时,将全部不符合表定义的数据忽略。 值为 false 时,若遇到脏数据,则给出错误提示信息,目标表内的原始数据不会被污染。
-mbr:默认情况下,当上传的脏数据超过 1000 条时,上传动作终止。通过此参数,可以调整可容忍的脏数据量。
-threads:指定 threads 的数量,默认为 1。

3、shell脚本实现批量文件的上传

for file in /test/tmpcsv/
do
./odpscmd -e
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值