文章目录
引言:
正则表达式,又称规则表达式。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本,正则表达式不只有一种,而且 Linux 中不同的程序可能会使用不同的正则表达式。
一.正则表达式定义
正则表达式,又称正规表达式、常规表达式,使用字符串来描述、匹配一些列符合某个规则的字符串
正则表达式是由普通字符与元字符组成
普通字符包括大小写字母、数字、标点符号及一些其他符号
元字符是指在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式
Linux 中常用的有两种正则表达式引擎
基础正则表达式:BRE
扩展正则表达式: ERE
二.正则表达式元字符
2.1基础正则表达式元字符
基础正则表达式常见元字符如下:
元字符 | 作用 |
---|---|
\ | 转义字符,用于取消特殊符号的含义 |
^ | 匹配字符串开始的位置 |
$ | 匹配字符串结束的位置 |
^$ | 匹配空行 |
. | 匹配除\n之外的任何一个字符 |
* | 匹配前面子表达式0次或多次 |
[list] | 匹配list列表中的一个字符 |
[^list] | 匹配任意非列表中的一个字符 |
{n} | 匹配前面子表达式不少于n次 |
{n,m} | 匹配前面子表达式n到m次 |
注:egrep、awk使用{}匹配时不用加\转义 |
1.\!,\n,\$等
2.^a以a开头; ^#以#开头 ;^[a-z]以字母a-z开头
3.word$ 以word结尾
4.go.d 匹配一个字符,good,goad,gozd ; go…d ;匹配两个字符,goabd,goefd