tr用来从标准输入中通过替换或删除操作,进行字符转换。tr主要用于删除文件中控制字符或进行字符转换。使用tr时要转换两个字符串:字符串1用于查询,字符串2用于处理各种转换,tr刚执行时,字符串1中的字符被映射到字符串2中的字符,然后转换操作开始。
1、用法和选项
用法:
tr [选项]... SET1 [SET2]
说明:
tr命令用于从标准输入中替换、缩减和/或删除字符,并将结果写到标准输出。
选项:
-c, -C, --complement 首先补足SET1
-d, --delete 删除匹配SET1 的内容,并不作替换
-s, --squeeze-repeats 如果匹配于SET1
的字符在输入序列中存在连续的重复,在替换时会被统一缩为一个字符的长度
-t, --truncate-set1 先将SET1 的长度截为和SET2 相等
--help 显示此帮助信息并退出
--version 显示版本信息并退出
2、SET字符串
SET 是一组字符串,一般都可按照字面含义理解。解析序列如下:
\NNN #八进制值为NNN 的字符(1 至3 个数位)
\\ #反斜杠
\a #终端鸣响
\b #退格
\f #换页
\n #换行
\r #回车
\t #水平制表符
\v #垂直制表符
字符1-字符2 #从字符1 到字符2 的升序递增过程中经历的所有字符
[字符*] #在SET2 中适用,指定字符会被连续复制直到吻合设置1 的长度
[字符*次数] #对字符执行指定次数的复制,若次数以 0 开头则被视为八进制数
[:alnum:] #所有的字母和数字
[:alpha:] #所有的字母
[:blank:] #所有呈水平排列的空白字符
[:cntrl:] #所有的控制字符
[:digit:] #所有的数字
[:graph:] #所有的可打印字符,不包括空格
[:lower:] #所有的小写字母
[:print:] #所有的可打印字符,包括空格
[:punct:] #所有的标点字符
[:space:] #所有呈水平或垂直排列的空白字符
[:upper:] #所有的大写字母
[:xdigit:] #所有的十六进制数
[=字符=] #所有和指定字符相等的字符
注意:
1、仅在SET1 和SET2 都给出,同时没有-d
选项的时候才会进行替换。
2、仅在替换时才可能用到-t 选项。如果需要SET2
将被通过在末尾添加原来的末字符的方式补充到同SET1 等长。SET2 中多余的字符将被省略。
3、只有[:lower:]
和[:upper:]以升序展开字符;在用于替换时的SET2 中以成对表示大小写转换。
4、-s 作用于SET1,既不替换也不删除,否则在替换或展开后使用SET2
缩减。
3、示例
(1)删除空行
[root@RHEL6 ~]# tr -s "[\012]" < plan.txt 或 tr -s ["\n"] < plan.txt
(2)去除test.txt里面的重复的小写字符
[root@RHEL6 ~]# tr -s "[a-z]"result.txt
(3)有时需要删除文件中的^M,并代之以换行
[root@RHEL6 ~]# tr -s "[\015]" "[\n]" < file
或
[root@RHEL6 ~]# tr -s "[\r]" "[\n]" < file
(4)大写到小写
[root@RHEL6 ~]# cat a.txt |tr "[a-z]" "[A-Z]" >b.txt
(5)删除指定字符
一个星期的日程表任务是从其中删除所有数字,只保留日期日期有大写,也有小写格式因此需指定两个字符范围[a-z]和[A-Z],命令tr
-cs "[a-z][A-Z]" "[\012*]"
将文件每行所有不包含在[a-z]或[A-Z](所有希腊字母)的字符串放在字符串1中并转换为一新行-s选项表明压缩所有新行,
-c表明保留所有字母不动原文件如下,后跟tr命令:
[root@RHEL6 ~]# tr -cs "[a-z][A-Z]" "[\012*]"
(6)替换passwd文件中所有冒号,代之以tab键,可以增加可读性
[root@RHEL6 ~]# tr -s "[:]" "[\011]" < /etc/passwd
或
[root@RHEL6 ~]# tr -s "[:]" "[\t]" < /etc/passwd
(7)使路径具有可读性
如果用 echo $PATH 或者 echo $LD_LIBRARY_PATH 等类似的命令来显示路径信息的话,我们看到的将会是一大堆用冒号连接在一起的路径, tr命令可以把这些冒号转换为回车,这样,这些路径就具有很好的可读性了
[root@RHEL6 ~]# echo $PATH | tr ":" "\n"
(8)可以在vim内使用所有这些命令!在tr命令前要加上您希望处理的行范围和感叹号 (!),如
$!tr -d '\t'(美元符号表示最后一行)
(9)转换控制字符
tr的第一个功能就是转换控制字符,特别是从dos向UNIX下载文件时,忘记设置ftp关于回车换行转换的选项时更是如此cat -v filename 显示控制字符
[root@RHEL6 ~]# cat -v Lstat.txt
box aa^^^^^12^M
apple bbas^^^^23^M
^Z
猜想^ ^ ^ ^ ^ ^是tab键每一行以Ctrl-M结尾,文件结尾Ctrl-Z,以下是改动方法
使用-s选项,查看ASCII表^的八进制代码是136,^M是015,tab键是011,^Z是032 ,下面将按步骤完成最终功能
用tab键替换^ ^ ^ ^ ^ ^,命令为"\136" "[\011*]"将结果重定向到临时工作文件Lstat.tmp
[root@RHEL6 ~]# tr -s "[\136]" "[\011*]" Lstat.tmp
用新行替换每行末尾的^M,并用\n去除^Z,输入要来自于临时工作文件Lstat.tmp
[root@RHEL6 ~]# tr -s "[\015][\032]" "\n"
要删除所有的tab键,代之以空格,使用命令
[root@RHEL6 ~]# tr -s "[\011]" "[\040*]"