shell之tr用法

tr用来从标准输入中通过替换/删除进行字符转换

主要用于删除文件中的控制字符或进行字符转换

 

使用时,提供两个字符串,串1:用于查询,串2:用于处理各种转换;串1的字符被映射到串2上,然后转换开始

 

主要用途:1.大小写转换

                  2.去除控制字符

                 3.删除字符

 

命令格式:

tr –c –d –s [“str_from”] [“str_to”] < file

-c,用字符串1中字符集的补集替换此字符集,要求字符集为ASCII

-d,删除字符串1中所有输入字符串

-s,删除所有重复出现字符序列,只保留一个,即重复字符串压缩为一个

 

字符范围——tr,可以指定字符串列表或范围作为形成字符串的模式,似正则,但不是正则。

[a-z] [A-Z] [0-9]    /octal一个三位八进制数,对应有效ASCII字符

[s*n]字符s出现n次

 

tr 中特定字符的不同表达方式

/a

Ctrl-g铃声

/007

/b

Ctrl-h退格

/010

/f

Ctrl-l走纸模式

/014

/n

Ctrl-J新行

/012

/r

Ctrl-M回车

/015

/t

Ctrl-I tab键

/011

/v

Ctrl-x

/030

 参数:


-s 压缩重复字符

-s: squeeze-repeats,用SET1指定的字符来替换对应的重复字符 (replace each input sequence of  a  repeated  character  that  is listed in SET1 with a single occurrence of that character

  1. xiaosi@Qunar:~/test$ echo "aaabbbaacccfddd" | tr -s [abcdf] // abacfd

可以使用这一特点,删除文件中的空白行,实质上跟上面一样,都是用SET1指定的字符来替换对应的重复字符

  1. xiaosi@Qunar:~/test$ cat b.txt
  2. I like football


  3. Football is very fun!

  4. Hello
  5. xiaosi@Qunar:~/test$ cat b.txt | tr -s ["\n"]
  6. I like football
  7. Football is very fun!
  8. Hello

-d 删除字符

-d:delete,删除SET1中指定的所有字符,不转换(delete characters in SET1, do not translate)

  1. xiaosi@Qunar:~/test$ echo "a12HJ13fdaADff" | tr -d "[a-z][A-Z]"
  2. 1213
  3. xiaosi@Qunar:~/test$ echo "a1213fdasf" | tr -d [adfs]
  4. 1213

-t 字符替换

-t:truncate,将SET1中字符用SET2对应位置的字符进行替换,一般缺省为-t  (-t可省略)

  1. xiaosi@Qunar:~/test$ echo "a1213fdasf" | tr -t [afd] [AFO] // A1213FOAsF

上述代码将a转换为A,f转换为F,d转换为O。

可以利用这一特点,实现大小字母的转换

  1. xiaosi@Qunar:~/test$ echo "Hello World I Love You" |tr -t [a-z] [A-Z]
  2. HELLO WORLD I LOVE YOU
  3. xiaosi@Qunar:~/test$ echo "HELLO WORLD I LOVE YOU" |tr -t [A-Z] [a-z]
  4. hello world i love you
也可以利用字符集合进行转换
  1. xiaosi@Qunar:~/test$ echo "Hello World I Love You" |tr -t [:lower:] [:upper:]
  2. HELLO WORLD I LOVE YOU
  3. xiaosi@Qunar:~/test$ echo "HELLO WORLD I LOVE YOU" |tr -t [:upper:] [:lower:]
  4. hello world i love you


备注:

字符集合如下

  1. \NNN 八进制值的字符 NNN (1 to 3 为八进制值的字符)
  2. \\ 反斜杠
  3. \a Ctrl-G 铃声
  4. \b Ctrl-H 退格符
  5. \f Ctrl-L 走行换页
  6. \n Ctrl-J 新行
  7. \r Ctrl-M 回车
  8. \t Ctrl-I tab
  9. \v Ctrl-X 水平制表符
  10. CHAR1-CHAR2 CHAR1 CHAR2的所有字符按照ASCII字符的顺序
  11. [CHAR*] in SET2, copies of CHAR until length of SET1
  12. [CHAR*REPEAT] REPEAT copies of CHAR, REPEAT octal if starting with 0
  13. [:alnum:] 所有的字母和数字
  14. [:alpha:] 所有字母
  15. [:blank:] 水平制表符,空白等
  16. [:cntrl:] 所有控制字符
  17. [:digit:] 所有的数字
  18. [:graph:] 所有可打印字符,不包括空格
  19. [:lower:] 所有的小写字符
  20. [:print:] 所有可打印字符,包括空格
  21. [:punct:] 所有的标点字符
  22. [:space:] 所有的横向或纵向的空白
  23. [:upper:] 所有大写字母

-c 字符补集替换

-c:complement,用SET2替换SET1中没有包含的字符

  1. xiaosi@Qunar:~/test$ cat a.txt
  2. Monday 09:00
  3. Tuesday 09:10
  4. Wednesday 10:11
  5. Thursday 11:30
  6. Friday 08:00
  7. Saturday 07:40
  8. Sunday 10:00
  9. xiaosi@Qunar:~/test$ cat a.txt | tr -c "[a-z][A-Z]" "#" | tr -s "#" | tr -t "#" "\n"
  10. Monday
  11. Tuesday
  12. Wednesday
  13. Thursday
  14. Friday
  15. Saturday
  16. Sunday

上面代码中 tr -c "[a-z][A-Z]" "#" 表示将除大小字母以外的所有的字符都替换为#。

上面代码可优化为:

  1. xiaosi@Qunar:~/test$ cat a.txt | tr -cs "[a-z][A-Z]" "\n"
  2. Monday
  3. Tuesday
  4. Wednesday
  5. Thursday
  6. Friday
  7. Saturday
  8. Sunday

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值