Shell 脚本应用（四）-CSDN博客

本文链接：https://blog.csdn.net/m0_73258133/article/details/135199899

本文介绍了正则表达式的概念，包括元字符的作用，以及在grep、sed和awk等文本处理工具中的应用，重点讲解了基础正则表达式的示例和元字符的使用，如特定字符查找、字符集合、行首行尾匹配、任意字符和重复字符等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

正则表达式概述

正则表达式又称正规表达式，常规表达式。在代码中常简写为regex，regexp 或RE.正则表达式是使用单个字符串来描述，匹配一系列符合某个句法规则的字符串，简单来说，是一种匹配字符串的方法，通过一些特殊符号，实现快速查找，删除、替换某个特定字符串。正则表达式是由普通字符与元字符组成的文字模式。模式用于描述在搜索文本时要匹配的一个或多个字符串，正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。其中普通字符包括大小写字母，数字，标点符号及一些其他符号，元字符则是指那些在正则表达式中具有特殊意义的专用字符，可以用来规定其前导字符（即位于元字符前面的字符）在目标对象中的出现模式.

基础正则表达式

正则表达式的字符串表达方法根据不同的严谨程度与功能分为基本正则表达式与扩展正则表达式，基础正则表达式是常用的正则表达式的最基础的部分，在Linux系统中常见的文件处理工具中 grep 与sed支持基础正则表达式，而egrep与awk支持扩展正则表达式。掌握基础正则表达式的使用方法，首先必须了解基本正则表达式所包含的元字符的含义，下面通过grep命令以举例的方式逐个介绍。

1.基础正则表达式示例

下面的操作需要提前准备一个名为test.txt的测试文件，文件具体内容如下所示.

（1）查找特定字符

查找特定字符非常简单，如执行以下命令即可从test.txt文件中查找出特定字符“the"所在位置. 其中“-n”表示显示行号，“-i”表示不区分大小写，命令执行后，符合匹配标准的字符，字体颜色会变为红色（本章中全部通过加粗显示代替）

[root@lgcllc ~]# grep -n 'the' test.txt

[root@lgcllc ~]# grep -in 'the' test.txt

若反向选择，如查找不包含“the”字符的行，则需要通过grep命令的‘-vn”选项实现.

[root@lgcllc ~]# grep -vn 'the' test.txt

（2）利用中括号“[ ]”来查找集合字符

想要查找“shirt”与“short”这两个字符串时，可以发现这两个字符串均包含“sh与rt".此时执行以下命令即可同时查找到“shirt与“short”这两个字符串.“I”中无论有几个字符，都仅代表一个字符，也就是说“[io]”表示匹配"i”或者“o”.

[root@lgcllc ~]# grep -n 'sh[io]rt' test.txt

若要查找包含重复单个字符‘oo”时，只需要执行以下命令即可。

[root@lgcllc ~]# grep -n 'oo' test.txt

若查找‘oo”前面不是‘w”的字符串，只需要通过集合字符的反向选择“[]”来实现该目的，如执行“grep -n“[^w]oo'test.txt”命令表示在test.txt文本中查找“oo”前面不是“w”的字符串。

[root@lgcllc ~]# grep -n '[^w]oo' test.txt

（3）查找行首“^” 与行尾字符“$”

查询the字符串时出现了很多包含“the”的行，如果想要查询以“the”字符串为行首的行，则可以通过 ' ^'元字符来实现。

[root@lgcllc ~]# grep -n '^the' test.txt

查询以小写字母开头的行可以通过“[a-z]”规则来过滤，查询大写字母开头的行则使用“[A-Z]” 规则，若查询不以字母开头的行则使用“[^a-zA-Z]”规则。

[root@lgcllc ~]# grep -n '^the' test.txt

[root@lgcllc ~]# grep -n '^[A-Z]' test.txt
[root@lgcllc ~]# grep -n '^[^a-zA-Z]' test.txt

当查询空白行时.执行“grep-n““s'test.txt”命令即可。

[root@lgcllc ~]# grep -n '^$' test.txt

（4）查找任意一个字符”.”与重复字符”*”

在正则表达式中小数点（.）也是一个元字符，代表任意一个字符。例如，执行以下命令就可以查找“w??d”的字符串，即共有四个字符，以w开头d结尾.

[root@lgcllc ~]# grep -n 'w..d' test.txt

若查询包含至少两个o以上的字符串，可执行以下语句

[root@lgcllc ~]# grep -n 'ooo*' test.txt

（5）查找连续字符范围“{ }”

在上面的示例中，我们使用“.”与“*”来设定零个到无限多个重复的字符，如果想要限制一个范围内的重复的字符串该如何实现呢？例如，查找三到五个o的连续字符，这个时候就需要使用基础正则表达式中的限定范围的字符“{ }”.因为“{ }”在Shell中具有特殊意义，所以在使用“{}” 字符时，需要利用转义字符“\”，将“{ }”字符转换成普通字符。“{}”字符的使用方法如下所示。

查询两个o的字符。