参考资料:《鸟哥的linux私房菜—基础篇》
1 什么是正则表达式?
**正则表达式(Regular Expression ,RE)**是透过一些特殊字符的排列,用以 [搜寻/取代/删除] 一列或多列文字字符串,简单地说,正则表达式就是用在字符串处理上面的一项 [表达式]
用途:利用正则表达式的功能将重要信息摘取出来,便于查阅。
说明:正则表达式基本上是一种 [表示法],只要工具程序支持,那么该工具程序就可以用来作为正则表达式的字符串处理之用。例如 vi grep awk sed 支持正则表达式,cp ls等指令不支持,只能使用bash自身的通配符。
2 基础正则表达式
2.1 语系对正则表达式的影响
例如,在英文大小写的编码顺序中,zh_TW.big5及C这两种语系的输出结果分别如下:
- LANG=C : 0 1 2 3 4 … A B C D…Z a b c d … z
- LANG=zh_TW.big5 : 0 1 2 3 4 … a A b B c C …z Z
【注】:底下的练习都是使用 LANG =C来进行
为了避免这样编码所造成的英文与数字的摘取问题,需要了解一些特殊符号:
2.2 使用grep