Ubuntu 批量修改文件名
一、rename命令
Linux的 rename 命令有两个版本(C语言和Perl语言),早期的Linux发行版基本上使用的是C语言版本,现在系统几乎都是Perl语言版本了(支持正则处理,功能更强大)[1]。可以通过命令man rename打开rename帮助文档查看版本,如果第一行内容如下,则是Perl语言版本。
RENAME(1) Perl Programmers Reference Guide RENAME(1)
鉴于Perl语言版本是主流,本文只介绍该版本下rename的用法,C语言版本操作见[1]。Perl语言版本的rename命令格式如下:
rename [ -v ] [ -n ] [ -f ] perlexpr [ files ]
-v(verbose)打印被成功重命名的文件
-n(no-act)只是显示将被重命名的文件,而不重命名(重命名之前可以用-n确认
需要重命名的文件)
-f(force)覆盖已经存在的文件
perlexprPerl语言格式的正则表达式
files需要被替换的文件(比如*.c、*.h),如果没给出文件名,将从标准输入读
先举个例子来感受下,比如将当前目录下所有*.nc文件中Sam3替换成Stm32,命令如下:
rename -n 's/Sam3/Stm32/' *.nc /*确认需要重命名的文件*/
rename -v 's/Sam3/Stm32/' *.nc /*执行修改,并列出已重命名的文件*/
整个命令的重点在于Perl语言正则表达式,下一部分将予以较详细的介绍。
二、Perl正则表达式
1 三种形式
匹配:m// (可以省略m,直接写成/regexp/)
替换:s///
转化:tr///
博文[3]给出了8种模式,rename命令常用到替换和转化两种(用匹配也没意义)。转换跟替换不同,替换是将replacement整个字符串替换pattern字符串,而转换则是用replacement逐个字符替换pattern逐个字符,结果依赖于replacement与pattern字符个数(见下述分析)。
(1)替换
替换表达方式如下
s/PATTERN/REPLACEMENT/egimosx
e Evaluate the right side as an expression.
g Match globally, i.e. all occurrences.
i Case-insensitive pattern matching.
m Treat string as multiple lines.
o Only compile pattern once, even if variables within it change.
s Treat string as single line.
x Use extended regular expressions
(2)转化
转化有两种等价表达方式,如下:
tr/SEARCHLIST/REPLACEMENTLIST/cds
y/SEARCHLIST/REPLACEMENTLIST/cds
c Complement the SEARCHLIST.
d Delete found but unreplaced characters.
s Squash duplicate replaced characters.
转化同替换不同,用REPLACEMENTLIST逐个字符替换SEARCHLIST逐个字符,比如’tr/Sam/Stm/’,用S替代S,t替代a,m替代m。结果依赖于两者字符长短,下面以文件名FastSpiSam3C.nc为例进行说明:
`rename -n 'tr/Sam3/Stm/' FastSpiSam3C.nc` /*替换字符短,用最后一个字符m替换3*/
FastSpiSam3C.nc renamed as FtstSpiStmmC.nc
`rename -n 'tr/Sam3/Stm32/' FastSpiSam3C.nc ` /*替换字符长,多出字符被忽略*/
FastSpiSam3C.nc renamed as FtstSpiStm3C.nc
三、实例
1 将所有*.cpp文件中app替换成apk
rename -v 's/app/apk/' *.cpp /*执行修改,并列出已重命名的文件*/
2 去掉文件后缀名(比如去掉.obj)
rename 's/\.obj$//' *.obj
3 将文件名改为小写
rename 'y/A-Z/a-z/' *
4 去掉文件名的空格
rename 's/[ ]+//g' *
5 文件开头加入字符串(比如myend)
rename 's/^/myend/' *
6 文件末尾加入字符串(比如myend)
rename 's/$/myend/' *
批量文件名加序号
i=1; for x in *; do mv $x $i.png; let i=i+1; done
###附录
常用的正则表达式
具体可以百度正则表达式语法
x? 匹配 0 次或一次 x 字符串
x* 匹配 0 次或多次 x 字符串,但匹配可能的最少次数
x+ 匹配 1 次或多次 x 字符串,但匹配可能的最少次数
.* 匹配 0 次或一次的任何字符
.+ 匹配 1 次或多次的任何字符
{m} 匹配刚好是 m 个 的指定字符串
{m,n}匹配在 m个 以上 n个 以下 的指定字符串
{m,} 匹配 m个 以上 的指定字符串
[] 匹配符合 [] 内的字符
[^] 匹配不符合 [] 内的字符
[0-9]匹配所有数字字符
[a-z]匹配所有小写字母字符
[^0-9]匹配所有非数字字符
[^a-z]匹配所有非小写字母字符
^ 匹配字符开头的字符
$ 匹配字符结尾的字符
\d 匹配一个数字的字符,和 [0-9] 语法一样
\d+ 匹配多个数字字符串,和 [0-9]+ 语法一样
\D 非数字,其他同 \d
\D+ 非数字,其他同 \d+
\w 英文字母或数字的字符串,和 [a-zA-Z0-9] 语法一样
\w+ 和 [a-zA-Z0-9]+ 语法一样
\W 非英文字母或数字的字符串,和 [^a-zA-Z0-9] 语法一样
\W+ 和 [^a-zA-Z0-9]+ 语法一样
\s 空格,和 [\n\t\r\f] 语法一样
\s+ 和 [\n\t\r\f]+ 一样
\S 非空格,和 [^\n\t\r\f] 语法一样
\S+ 和 [^\n\t\r\f]+ 语法一样
\b 匹配以英文字母,数字为边界的字符串
\B 匹配不以英文字母,数值为边界的字符串
a|b|c 匹配符合a字符 或是b字符 或是c字符 的字符串
abc 匹配含有 abc 的字符串