大文件分割并将字段定长输出

场景:接到需求,需要将一个五千万的表数据导出上传;

要求:文件大小小于2G,每个文件需增加行号,文件中的每个字段长度与接口规范保持一致;

操作:

第一步:将表中数据导出生成文件di_tmp.20200229,指定tab符为分割符;根据每行文件的总长度,每个文件大小小于2G,计算出每个文件的记录数为80万

第二步:分割文件,80万记录为一个文件,通过split命令对文件按行数进行分割

split -l 800000 di_tmp.20200229 new_di_tmp.20200229

分割后有多个文件,新文件的名称为:new_di_tmp.20200229aa,new_di_tmp.20200229ab,new_di_tmp.20200229ab...

第三步:对分割后的文件进行定长转换,通过awk命令对文件进行定长转换

cat new_di_tmp.20200229aa |awk -F"\t" '{printf ("%-8s%-1s%-15s%-15s%-17s%-4s\n",FNR,$1,$2,$3,$4,$5)}'

这里需要注意:awk命令后跟的分割符"\t",需要和数据库导出数据的分割符一致,这里都是用的tab符;通过FNR增加行号

操作结束。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值