(点击上方快速关注并设置为星标,一起学Python)
最近做的一个项目,因为之前代码不严谨,生产环境产生了大量的临时文件,占用了较大的存储,因此需要将该部分数据删掉。
首先,先拼接好要执行的Linux命令行,保存为del_tmp.txt,如下:
rm -f /mnt/doclib/agreement/2017/7/6/1/agreement/*.jpg
rm -f /mnt/doclib/agreement/2017/7/6/2/agreement/*.jpg
rm -f /mnt/doclib/agreement/2017/7/6/3/agreement/*.jpg
rm -f /mnt/doclib/agreement/2017/7/6/4/agreement/*.jpg
rm -f /mnt/doclib/agreement/2017/7/6/5/agreement/*.jpg
rm -f /mnt/doclib/agreement/2017/7/6/6/agreement/*.jpg
rm -f /mnt/doclib/agreement/2017/7/6/8/agreement/*.jpg
...
大约有100W+行。
然后,写一个简单的脚本,执行读入文件删除的功能:
#!/bin/bash
进入Linux执行,发现能正常跑,但是没有真正删除文件。而单独执行命令行,确实能够删除文件。
究竟是什么原因呢?于是,使用vi -b del_tmp.txt 查了一下文件,发现换行符有问题:
也可以通过命令行 head -10 del_tmp.txt | cat -A来进行查看,如下:
这是因为Linux在执行命令时,换行符是$,而Windows下则是^M$,多了^M,所以,需要把^M去掉。
这里有2种方式:
文件格式转换
一种文件格式转换,即使用doc2unix命令直接对文件格式进行转换:
doc2unix del_tmp.txt
执行完成后,发现^M已经去掉。
字符替换
字符替换主要有2种方式:
(1)在使用vi 打开文件后,运用字符替换功能:
:%s/^M//g
将^M去掉,值得注意的是,^M并非直接复制,二是(Ctrl +V) 以及(Ctrl + M)打印出来。
(2)使用sed进行文本中的字符串替换,具体如下
sed -i 's/^M//g' del_tmp.txt
同样,^M并非直接复制,二是(Ctrl +V) 以及(Ctrl + M)打印出来。
这两种方式都可以去掉^M。
修改完文件格式,再执行脚本进行文件的删除,就完全没问题了。
(完)
看完本文有收获?请转发分享给更多人
关注「Python那些事」,做全栈开发工程师