shell修改文件内容_Shell结合 sed 与 mv 批量修改文件名

使用 wget 下载数据后发现文件名全带了链接的 query 符号:

$ ls
download?fn=%2FPCAWG%2Fclinical_and_histology%2Fpcawg_donor_clinical_August2016_v9.xlsx
download?fn=%2FPCAWG%2Fclinical_and_histology%2Fpcawg_donor_subtype_cohort_list.xlsx
download?fn=%2FPCAWG%2Fclinical_and_histology%2Fpcawg_specimen_histology_August2016_v9.xlsx
download?fn=%2FPCAWG%2Fconsensus_cnv%2Fconsensus.20170119.somatic.cna.annotated.tar.gz
download?fn=%2FPCAWG%2Fconsensus_cnv%2Fconsensus.20170119.somatic.cna.icgc.public.tar.gz
download?fn=%2FPCAWG%2Fconsensus_cnv%2Fconsensus.20170119.somatic.cna.tcga.public.tar.gz
download?fn=%2FPCAWG%2Fconsensus_cnv%2Fconsensus.20170217.purity.ploidy.txt.gz
download?fn=%2FPCAWG%2Fconsensus_snv_indel%2Ffinal_consensus_passonly.snv_mnv_indel.icgc.public.maf.gz
download?fn=%2FPCAWG%2Fconsensus_sv%2Ffinal_consensus_sv_bedpe_passonly.icgc.public.tgz
download?fn=%2FPCAWG%2Fconsensus_sv%2Ffinal_consensus_sv_bedpe_passonly.tcga.public.tgz

所以最好把前面的内容去掉,sed 可以使用模式匹配进行文本修改,而 mv 可以重命名文件,我们结合两者试试。首先用单个文件测试修改方式是否正确:

$ echo download?fn=%2FPCAWG%2Fclinical_and_histology%2Fpcawg_specimen_histology_August2016_v9.xlsx | sed -E 's/.*%2(.*)/\1/'
Fpcawg_specimen_histology_August2016_v9.xlsx

然后检测下目录下的所有文件都可以这样处理:

$ ls | sed -E 's/.*%2(.*)/\1/'
Fpcawg_donor_clinical_August2016_v9.xlsx
Fpcawg_donor_subtype_cohort_list.xlsx
Fpcawg_specimen_histology_August2016_v9.xlsx
Fconsensus.20170119.somatic.cna.annotated.tar.gz
Fconsensus.20170119.somatic.cna.icgc.public.tar.gz
Fconsensus.20170119.somatic.cna.tcga.public.tar.gz
Fconsensus.20170217.purity.ploidy.txt.gz
Ffinal_consensus_passonly.snv_mnv_indel.icgc.public.maf.gz
Ffinal_consensus_sv_bedpe_passonly.icgc.public.tgz
Ffinal_consensus_sv_bedpe_passonly.tcga.public.tgz

实际改名字需要使用 for 循环进行迭代:

$ for f in `ls`; do echo `echo $f | sed -E 's/.*%2(.*)/\1/'`; done
Fpcawg_donor_clinical_August2016_v9.xlsx
Fpcawg_donor_subtype_cohort_list.xlsx
Fpcawg_specimen_histology_August2016_v9.xlsx
Fconsensus.20170119.somatic.cna.annotated.tar.gz
Fconsensus.20170119.somatic.cna.icgc.public.tar.gz
Fconsensus.20170119.somatic.cna.tcga.public.tar.gz
Fconsensus.20170217.purity.ploidy.txt.gz
Ffinal_consensus_passonly.snv_mnv_indel.icgc.public.maf.gz
Ffinal_consensus_sv_bedpe_passonly.icgc.public.tgz
Ffinal_consensus_sv_bedpe_passonly.tcga.public.tgz

上面在实际调用 mv 之前检测一下这样操作不会有问题,然后修改为实际要重命名的操作。

$ for f in `ls`; do mv $f `echo $f | sed -E 's/.*%2(.*)/\1/'`; done
$ ls
Fconsensus.20170119.somatic.cna.annotated.tar.gz            Ffinal_consensus_sv_bedpe_passonly.icgc.public.tgz
Fconsensus.20170119.somatic.cna.icgc.public.tar.gz          Ffinal_consensus_sv_bedpe_passonly.tcga.public.tgz
Fconsensus.20170119.somatic.cna.tcga.public.tar.gz          Fpcawg_donor_clinical_August2016_v9.xlsx
Fconsensus.20170217.purity.ploidy.txt.gz                    Fpcawg_donor_subtype_cohort_list.xlsx
Ffinal_consensus_passonly.snv_mnv_indel.icgc.public.maf.gz  Fpcawg_specimen_histology_August2016_v9.xlsx

最后本文可以抽象出来的一个通用操作是:

for f in `ls`; do  `echo $f | sed -E ; done

该模板可以应用于其他想要进行先修改文件名然后运行命名的操作。

ea1d7691726101b97468ee05ac1fcd15.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值