Linux系统学习之正则表达式

最新推荐文章于 2023-02-19 19:31:27 发布

刘大能

最新推荐文章于 2023-02-19 19:31:27 发布

阅读量390

点赞数

分类专栏： linux 文章标签： linux 正则表达式

本文链接：https://blog.csdn.net/liu201812/article/details/102554545

版权

linux 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

一、基础的正则表达式

1."."（一个点)符号

点符号用于U匹配除换行符号之外的任意一个字符。例如:r.t可以匹配rot、rut，但是不能匹配root，但如果使用r…t，就可以匹配root、ruut、r t(中间是两个空格)等。

2.“*”符号

“"号用于匹配前一个字符0次或任意多次，比如ab,可以匹配a、ab、abb等。”“号经常和”.“符号加在一起使用。比如”."代表任意长度的不包含换行的字符。

3.“{n,m}"符号

虽然"*“可用于重复匹配前一个字符，但却不能精确地控制匹配的重复次数，使用”{n,m}"符号则能更加灵活地控制字符的重复次数，典型的有以下三种形式:

{n} 匹配前面的字符n次。下列匹配的是包含root的行（r和t中包含两个o)

[root@Cfhost-170820-UCNK ~]# grep ‘ro{2}t’ /etc/passwd
root❌0:0:root:/root:/bin/bash
operator❌11:0:operator:/root:/sbin/nologin

{n,}匹配前面的字符至少n次以上(含n次)

[root@Cfhost-170820-UCNK ~]# grep ‘ro{0,}t’ /etc/passwd
root❌0:0:root:/root:/bin/bash
operator❌11:0:operator:/root:/sbin/nologin
vcsa❌69:69:virtual console memory owner:/dev:/sbin/nologin
{n,m}匹配前面的字符n到m次

4."^{"这个符号位于数字键盘6的上面，又称尖角号。这个符号用于匹配开头的字符。比如说"}root" 匹配的是以字母root开始的行

[root@Cfhost-170820-UCNK ~]# grep ‘^root’ /etc/passwd
root❌0:0:root:/root:/bin/bash
5.“$"符号

和上面的尖角号相对，“ $" 用于匹配尾部，比如说 " a b c$ “代表的是以abc结尾的行。如果是”^ $则代表该行为空，因为^和$ 间什么都没有。下例匹配的是以r开头，中间有一串任意字符，以h结尾

[root@Cfhost-170820-UCNK ~]# grep ‘^r.*h$’ /etc/passwd
root❌0:0:root:/root:/bin/bash
6."[]"符号

这是一对方括号，用于匹配方括号出现的任一字符。比如说单选题的答案，可能是ABCD选项中的任意一个，正则表达式表示的就是[ABCD].如果遇到比较大范围的匹配，比如说要匹配任意一个大写字符，就需要使用"-"号做范围限定，写成[A-Z],要匹配所有字母则写成[A-Za-z].一定要注意，这里的”-“的作用不是充当一个字符。

如果是要匹配不是大写字母A、B、C、D的字符又该怎么写？还记得上面的"^{"号吗？如果这个符号出现在[]中，则代表取反，也就是不是的意思。那这里的写法就是[}A-D],事情变得有点复杂了。

这里举个例子，看如何匹配手机号。手机号是11位连续的数字，第一位一定是1，所有表示"^1";第二位有可能是3(移动）或8(联通),表示为"[38]";后面连续9个任意数字，表示为

“[0-9]{9}”;所以整个表达式应该写为"¹[0-9]{9}"

7."“符号|
假设有一个固定电话号码021-88888888，当然也可以写成 021 88888888（区号和电话号码之间用空格隔开），它们的不同之处就是区号和电话号码之间使用的符号不同，一个是
“-”，一个是空格。那么，对于这个电话号码要怎么匹配呢？很容易地想起应该使用”[]“来匹配。但是这么写:[-]是不对的，因为”-“放到”[]“中有特别含义。为了表示其作为一个字符的本意，就要使用”"符了，这个符号代表转义字符，我们可以对很多特殊的字符进行“转义”，让它只代表字符本身，因此这里的写法就是[\ -].

再举个例子，之前我们了解到"."代表的是任意长度的不包括换行的重复字符。但是如果想要匹配任意长度的点号呢？这时我们用转义字符就对了：“."。如果想要对”“符号进行转义，就可以这样写：“\”。

8."<“符号和”>"符号

这两个符号分别用于界定单词的左边界和右边界。birushuo"<hello"用于匹配以”helo"开头的单词；而"hell>"则用于匹配以"hello"结尾的单词。还可以2使用它们的组合“<>"用于精确匹配一个字符串。所以”<hello>“可精确匹配单词"hello”,而不是helloworld等。如下所示:

[root@Cfhost-170820-UCNK ~]# echo “hello” | grep ‘<hello>’
hello
[root@Cfhost-170820-UCNK ~]# echo “hellod” | grep ‘<hello>’
#//没有输出，表示匹配不成功
9.”\d"符号

匹配一个数字，等价于[0-9],使用grep匹配这种正则表达式时，可能会遇到无法匹配的问题，示例如下:

复制代码
[root@Cfhost-170820-UCNK ~]# echo 123 | grep [0-9]
123
[root@Cfhost-170820-UCNK ~]# echo 123 | grep ‘\d’
#没有输出，表示匹配不成功，为什么呢？
#这是因为"\d"是一种Per1兼容模式的表达式，又称作PCRE,要想使用这种模式的匹配符，需要加上-P参数

[root@Cfhost-170820-UCNK ~]# echo 123 | grep -P ‘\d’
123

复制代码
10.“b"符号

匹配单词的边界，比如"\bhello\b"可精确匹配"hello"单词

[root@Cfhost-170820-UCNK ~]# echo “hello world” |grep ‘\bhello\b’
hello world
[root@Cfhost-170820-UCNK ~]# echo “helloworld” |grep ‘\bhello\b’
#这里没有匹配
11."\B"符号

匹配非单词的边界，比如hello\B可以匹配"helloworld“中的"hello"

[root@Cfhost-170820-UCNK ~]# echo “helloworld” |grep ‘hello\B’
helloworld
12."\w"符号

匹配字母、数字、下划线,等价于[A-Za-z0-9]

[root@Cfhost-170820-UCNK ~]# echo “a” | grep ‘\w’
a
[root@Cfhost-170820-UCNK ~]# echo “\” | grep ‘\w’
14."\n"符号

匹配一个换行符

15.”\r"符号

匹配一个回车符

16."\t"符号

匹配一个制表符

17."\f"符号

匹配一个换页符

18."\s"符号