linux下的tr命令

原址:

http://www.360doc.com/content/10/0926/09/1107705_56449410.shtml(360doc真够不要脸的,不注册不能复制)

http://study.chyangwa.com/IT/AIX/aixcmds5/tr.htm#a0939bb(命令参考大全之tr命令)

tr 命令

用途

转换字符。

语法

tr -c | -cds -cs | -C | -Cds | -Cs | -ds |  -s ][  -A ] String1 String2

tr { -cd -cs | -Cd | -Cs |  -d -s } [  -A ] String1

描述

tr 命令从标准输入删除或替换字符,并将结果写入标准输出。根据由 String1String2 变量指定的字符串以及指定的标志,tr 命令可执行三种操作。

转换字符

如果 String1 String2 两者都已指定,但 -d 标志没有指定,则 tr 命令就会从标准输入中将 String1 中所包含的每一个字符都替换成 String2 中相同位置上的字符。

使用 -d 标志删除字符

如果 -d 标志已经指定,则 tr 命令就会从标准输入中删除 String1 中包含的每一个字符。

用 -s 标志除去序列

如果 -s 标志已经指定,则 tr 命令就会除去包含在 String1String2 中的任何字符串系列中的除第一个字符以外的所有字符。对于包含在 String1 中的每一个字符,tr 命令会从标准输出中除去除第一个出现的字符以外的所有字符。对于包含在 String2 中的每一个字符,tr 命令除去标准输出的字符序列中除第一个出现的字符以外的所有字符。

表达字符串的特殊序列

String1 String2 变量中所包含的字符串可以使用以下的约定来表示:

C1-C2指定了 C1 所指定的字符和 C2 所指定的字符之间(包括 C1 和 C2)进行整理的字符串。C1 所指定的字符必须整理放在由 C2 所指定的字符之前。
注:
在使用本方法指定子范围时,当前语言环境对结果有重要影响。如果需要用命令来产生与语言环境无关的一致结果,则应该避免使用子范围。
[C*Number]Number 是一个整数,它指定了由 C 所指定的字符的重复次数。除非其首位数字是 0,否则 Number 一律视为是十进制整数;如果首位数字是 0,则视为八进制整数。
[C*]C 指定的字符填写字符串。该选项只用于包含在 String2 中的字符串末尾,它强制 String2 中的字符串具有与由 String1 变量所指定的字符串一样的字符数。*(星号)后面指定的任何字符都被忽略。
[ :ClassName: ]指定由当前语言环境中的 ClassName 所命名的字符类中的所有字符。类名可以是下述名称中的任何一种:
alnum      lower
alpha      print
blank      punct
cntrl      space
digit      upper
graph      xdigit

[:lower:][:upper:] 转换字符类之外,其它字符类指定的字符都按未指定的顺序放入数组中。由于未定义字符类指定的字符的顺序,仅当目的为将多个字符映射为一个时才使用这些字符。转换字符类除外。

有关字符类的详细情况,请参阅 ctype 子例程。

[ =C= ]指定所有的字符具有与 C 所指定的字符相同的等价类。
\Octal指定字符,其编码由 Octal 所指定的八进制值表示。Octal 可以是 1 位、2 位 或 3 位八进制整数。空字符可以用 '\0' 表示,并可以像任何其它的字符那样进行处理。
\ControlCharacter指定与 ControlCharacter 所指定的值相应的控制字符。可以表示以下值:
\a
警告
\b
退格键
\f
换页
\n
换行
\r
回车
\t
制表键
\v
垂直制表键
\\规定 "\"(反斜杠)就是作反斜杠使用,而无作为转义字符的任何特殊意义。
\[指定“[”(左括号)就作为左括号使用,而无作为特定字符串序列的开始字符的任何特殊意义。
\-指定“-”(负号)就作为负号使用,而无作为范围分隔符的任何特殊意义。

如果某个字符在 String1 中被指定过多次,则该字符就被转换成 String2 中为与 String1 中最后出现的字符相对应的字符。

如果由 String1 String2 指定的字符串长度不相同,则 tr 命令就会忽略较长一个字符串中的多余字符。

标志

-A使用范围和字符类 ASCII 整理顺序、一个字节一个字节地执行所有操作,而不是使用当前语言环境整理顺序。
-C指定 String1 值用 String1 所指定的字符串的补码替换。String1 的补码是当前语言环境的字符集中的所有字符,除了String1 指定的字符以外。如果指定了 -A -c 标志都已指定,则与所有 8 位字符代码集合有关的字符将被补足。如果指定了 -c -s 标志,则 -s 标志适用于 String1 的补码中的字符。

如果没有指定 -d 选项,则由 String1 指定的字符的补码将放置到升序排列的数组中(如 LC_COLLATE 的当前设置所定义)。

-c指定 String1 值用 String1 所指定的字符串的补码替换。String1 的补码是当前语言环境的字符集中的所有字符,除了String1 指定的字符以外。如果指定了 -A -c 标志都已指定,则与所有 8 位字符代码集合有关的字符将被补足。如果指定了 -c -s 标志,则 -s 标志适用于 String1 的补码中的字符。

如果没有指定 -d 选项,则由 String1 指定的值的补码将放置到通过二进制值升序排列的数组中。

-d从标准输入删除包含在由 String1 指定的字符串中的每个字符。
注:
  1. -C 选项和 -d 选项一起指定时,将删除所有除 String1 指定的那些字符以外的字符。忽略 String2 的内容,除非也指定了 -s 选项。
  2. -c 选项和 -d 选项一起指定时,将删除所有除 String1 指定的那些字符以外的字符。忽略 String2 的内容,除非也指定了 -s 选项。
-s在重复字符序列中除去除第一个字符以外的所有字符。将 String1 所指定的字符序列在转换之前从标准输入中除去,并将 String2 所指定的字符序列从标准输出中除去。
String1指定一个字符串。
String2指定一个字符串。

退出状态

该命令返回以下出口值:

0所有输入处理成功。
>0产生错误。

示例

  1. 若要将大括号转换为小括号,请输入:
    tr '{}' '()' < textfile > newfile

    这便将每个 {(左大括号)转换成 ((左小括号),并将每个 }(右大括号)转换成 )(右小括号)。所有其它的字符都保持不变。

  2. 若要将大括号转换成方括号,请输入:
    tr '{}' '\[]' < textfile > newfile

    这便将每个 {(左大括号)转换成 [(左方括号),并将每个 }(右大括号)转换成 ](右方括号)。左方括号必须与一个 "\"(反斜扛)转义字符一起输入。

  3. 若要将小写字符转换成大写,请输入:
    tr 'a-z' 'A-Z' < textfile > newfile
  4. 若要创建一个文件中的单词列表,请输入:
    tr -cs '[:lower:][:upper:]' '[\n*]' < textfile > newfile

    这便将每一序列的字符(除大、小写字母外)都转换成单个换行符。*(星号)可以使 tr 命令重复换行符足够多次以使第二个字符串与第一个字符串一样长。

  5. 若要从某个文件中删除所有空字符,请输入:
    tr -d '\0' < textfile > newfile
  6. 若要用单独的换行替换每一序列的一个或多个换行,请输入:
    tr -s '\n' < textfile > newfile

    tr -s '\012' < textfile > newfile
  7. 若要以“?”(问号)替换每个非打印字符(有效控制字符除外),请输入:
    tr -c '[:print:][:cntrl:]' '[?*]' < textfile > newfile

    这便对不同语言环境中创建的文件进行扫描,以查找当前语言环境下不能打印的字符。

  8. 要以单个“#”字符替换 <space> 字符类中的每个字符序列,请输入:
    tr -s '[:space:]' '[#*]'

tr是translate的简写,亦即翻译,但是遗憾的是,它不能翻译句子,只能翻译单个字符。

1 tr的工作原理是什么?

先记住一点,tr命令不接受指定的文件参数,而只是对标准输入进行翻译。好了,记住这点后,我们继续。

tr的命令格式是tr SET1 SET2,凡是在SET1中的字符,都会被替换为SET2中相应位置上的字符,简单吧!

2 举个例子吧!

tr的例子其实都大同小异,看一个最简单的例子:

我们有一个包含了四个人身高的数据文件,名字叫height.txt,它的内容是这样的:

[rocrocket@rocrocket programming]$ cat height.txt
1.79 1.83
1.65 1.59

我们想搞一个恶作剧,将所有人的身高从1米级别都提高到2米级别,呵呵,一个tr就可以搞定。
[rocrocket@rocrocket programming]$ tr 1 2 < height.txt
2.79 2.83
2.65 2.59

希望你没有忘记,tr只处理标准输入,所以我们需要将height.txt通过重定向指到tr的标准输入才可以。

3 我们可以用tr来修改文件中的间隔符么?

Good idea!

当使用cut的时候,通常会被间隔符问题所困扰,我们这个时候可以考虑到tr这个命令。

还是以height.txt文件为例,其中的间隔符是空格,我们把它修改为制表符吧!

[rocrocket@rocrocket programming]$ tr ‘ ‘ ‘\11′ < height.txt
1.79    1.83
1.65    1.59

这里有一个小知识点,像制表符、换行符这些字符不好表示,我们可以考虑使用ASCII的八进制形式来表示,制表符的八进制形式是11,回车是15,换行是12。而在tr命令中,可以使用\nnn形式表示八进制形式的字符。如果你实在记不住这些编号,那么用\t表示制表符你总该可以记住吧!(\n代表新行,\r代表回车)

这下,你应该可以理解上面那条命令的作用了吧。如果你仍然怀疑,那么,看看下面这条命令,你就该心服口服了:

[rocrocket@rocrocket programming]$ tr ‘ ‘ ‘\11′ < height.txt |sed -n l
1.79\t1.83$
1.65\t1.59$

看!空格的的确确被替换成了制表符喽!

4 使用tr能把文章中的小写都转换成大写么?

这个正是tr所擅长的地方。

加入我们拥有一个文件叫做word.txt,里面包含的内容是AbcdE。

那么最简单的替换大小写的方法是:

[rocrocket@rocrocket programming]$ cat word.txt
AbcdE
[rocrocket@rocrocket programming]$ tr ‘a-z’ ‘A-Z’ < word.txt
ABCDE

5 [CHAR*]怎么用?

这是 SET2 专用的设定,功能是重复指定的字符到与 SET1 相同长度为止

例子:

[rocrocket@rocrocket programming]$ cat number.txt
1234567890
[rocrocket@rocrocket programming]$ tr ‘1-5′ ‘[A*]‘ < number.txt
AAAAA67890

6 [CHAR*REPEAT]怎么用?

这也是SET2专用的设定,功能是将CHAR重复REPEAT次数。其中REPEAT次数可以用八进制数表示,但记得要以0开头表示八进制数。

例子:

[rocrocket@rocrocket programming]$ tr ‘1-9′ ‘[A*5]BCDE’ < number.txt
AAAAABCDE0

7 在tr中还有哪些表示集合的符号呢?

[:alnum:] :所有字母字符与数字
[:alpha:] :所有字母字符
[:blank:] :所有水平空格
[:cntrl:] :所有控制字符
[:digit:] :所有数字
[:graph:] :所有可打印的字符(不包含空格符)
[:lower:] :所有小写字母
[:print:] :所有可打印的字符(包含空格符)
[:punct:] :所有标点字符
[:space:] :所有水平与垂直空格符
[:upper:] :所有大写字母
[:xdigit:] :所有 16 进位制的数字

例子:

将所有的数字都转换为字符x。

[rocrocket@rocrocket programming]$ tr [:alnum:] ‘[x*]‘ < number.txt
xxxxxxxxxx

8 tr里面包含SET1和SET2,那如果出现两个集合的大小不同的情况,tr如何处理呢?

这个问题,最好的解决办法就是做实验啊。

第一种情况是SET1>SET2:

[rocrocket@rocrocket programming]$ tr 1-5 AB < number.txt
ABBBB67890

结论一下子就出来了,SET1中多出来的字符都会和SET2中最后一个字符相对应。

第二种情况SET1<SET2:

[rocrocket@rocrocket programming]$ tr 1-3 ABCDE < number.txt
ABC4567890

很明了,SET2中多余的部分将被抛弃。

9 讲一讲tr命令的-s选项吧!

这个-s选项,是专门针对SET1起作用的,意思是如果发现有连续的SET1里的字符,就把它们缩减为1个。

一个很经典的应用就是把不规律的空格缩减为一个空格:

[rocrocket@rocrocket programming]$ cat spaces.txt
How   are               you?
Fine! Thank    you!
[rocrocket@rocrocket programming]$ tr -s ‘ ‘ ‘ ‘ < spaces.txt
How are you?
Fine! Thank you!

效果很明显,用户很满意。恩!

10 -d选项咋用?

-d选项是用来删除字符用的。格式是这样的:tr -d charset

[rocrocket@rocrocket programming]$ tr -d ‘ ‘ < spaces.txt
Howareyou?
Fine!Thankyou!

看,该有的空格都没了…这就是-d的作用,把空格都删除了!

如果你想把文章中的数字都删除,就tr -d [0-9] < filename就可以了。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值