什么是tr命令?
tr:translate的简写,在这里用到的意思是转化,转变,转换,在linux下输入$ tr --help
root$ tr --help
tr [选项]… 集合1 [集合2]
选项说明:
-c, -C, –complement 用集合1中的字符串替换,要求字符集为ASCII。
-d, –delete 删除集合1中的字符而不是转换
-s, –squeeze-repeats 删除所有重复出现字符序列,只保留第一个;即将重复出现字符串压缩为一个字符串。
-t, –truncate-set1 先删除第一字符集较第二字符集多出的字符
字符集合的范围:
\NNN 八进制值的字符 NNN (1 to 3 为八进制值的字符)
\\ 反斜杠
\a Ctrl-G 铃声
\b Ctrl-H 退格符
\f Ctrl-L 走行换页
\n Ctrl-J 新行
\r Ctrl-M 回车
\t Ctrl-I tab键
\v Ctrl-X 水平制表符
CHAR1-CHAR2 从CHAR1 到 CHAR2的所有字符按照ASCII字符的顺序
[CHAR*] in SET2, copies of CHAR until length of SET1
[CHAR*REPEAT] REPEAT copies of CHAR, REPEAT octal if starting with 0
[:alnum:] 所有的字母和数字
[:alpha:] 所有字母
[:blank:] 水平制表符,空白等
[:cntrl:] 所有控制字符
[:digit:] 所有的数字
[:graph:] 所有可打印字符,不包括空格
[:lower:] 所有的小写字符
[:print:] 所有可打印字符,包括空格
[:punct:] 所有的标点字符
[:space:] 所有的横向或纵向的空白
[:upper:] 所有大写字母
主要用来对来自标准输入的字符串从set1映射到set2,并将其输出写入stdout(标准输出).set1和set2是字符类或字符集。如果两个字符集的长度不相等,那么set2会不断重复其最后一个字符,直到长度与set1相同。如果set2的长度大于set1,那么在set2中超出set1长度的那部分字符则全部被忽略。
其调用格式如上示:
tr [OPTION]... SET1 [SET2]
实际应用1,大小写转换,"a-z"和"A-Z"都是集合(set),集合表示方式非常简单即"起始字符-终止字符"。
localhost:~ wang$ echo 'NAME IS:'
NAME IS:
localhost:~ wang$ echo 'NAME IS:' | tr 'A-Z' 'a-z'
name is:
实际应用2,删除字符:
ls | tr -d ‘\n’ 删除换行符(所有内容拼接成一行)
echo "hello 132 world 56 " | tr -d '0-9' #删除数字
实际应用3,字符集补集:
tr -c [set1] [set2]
et1的补集意味着从这个集合中包含set1中没有的所有字符。
最典型的用法就是从输入文本中将不在补集中的所有字符全部删除。例如:
$ echo "hello 123 world " | tr -d -c '0-9 \n'
123
在这里,补集中包含了除数字、空格字符和换行符之外的所有字符,因为指定了-d,所以这些字符全部都会被删除。
参考: