目录
1.基础正则表达式常见元字符(支持grep、egrep、sed、awk)
2. 扩展正则表达式元字符(支持:egrep、grep -E、awk、sed -r)
3.匹配文件中025开头,后一个字符为"-"、" " 或没有,之后为5或8开头的数字,总位数为11位
一、正则表达式简介
在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。在很多文本编辑器或其他工具里,正则表达式通常被用来检索或替换那些符合某个模式的文本内容。许多程序设计语言都支持利用正则表达式进行字符串操作。
只有掌握了正则表达式,才能全面地掌握 Linux 下的常用文本工具(例如:grep、egrep、sed、awk 等) 的用法。
二、正则表达式的组成
正则表达式由普通字符与元字符组成。
-
普通字符包括大小写字母、数字、标点符号及一些其他符号。
-
元字符是指在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符或表达式,可以使用()括起来指定)在目标对象中的出现模式。
三、正则表达式分类
-
基本的正则表达式(Basic Regular Expression 又叫 Basic RegEx 简称 BREs)
-
扩展的正则表达式(Extended Regular Expression 又叫 Extended RegEx 简称 EREs)
-
Perl 的正则表达式(Perl Regular Expression 又叫 Perl RegEx 简称 PREs)
四、正则表达式字符用法
1.基础正则表达式常见元字符(支持grep、egrep、sed、awk)
字符 | 用法 |
---|---|
\ | 转义字符,用于取消特殊符号的含义,例:!、\n、$等表示这些符号本身 |
^ | 匹配字符串开始的位置,例:^a、^the、^#、^[a-z] 等表示以...开头 |
$ | 匹配字符串结束的位置,例:word$表示以...结尾;^$匹配空行 |
. | 匹配除\n之外的任意的一个字符,例:go.d表示匹配.处的一个字符 |
* | 匹配前导字符 |