shell编程 —— 正则表达式学习笔记

最新推荐文章于 2023-12-21 23:58:07 发布

Aliven888

最新推荐文章于 2023-12-21 23:58:07 发布

阅读量106

点赞数

分类专栏： Linux 文章标签： linux 正则表达式 regex

本文链接：https://blog.csdn.net/Aliven888/article/details/108417878

版权

Linux 专栏收录该内容

41 篇文章 6 订阅

订阅专栏

文档声明：
以下资料均属于本人在学习过程中产出的学习笔记，如果错误或者遗漏之处，请多多指正。并且该文档在后期会随着学习的深入不断补充完善。感谢各位的参考查看。

笔记资料仅供学习交流使用，转载请标明出处，谢谢配合。
如果存在相关知识点的遗漏，可以在评论区留言，看到后将在第一时间更新。
作者：Aliven888

1、什么事正则表达式

正则表达式实际上是一种概念，很多时候，正则表达式又被成为模式，它是对一类具有相同特征数据的描述。

2、正则表达式语法

正则表达式通常和shell中的查询指令配合使用。关于grep的使用我们在《linux 常用 shell 指令学习笔记总结》文章中已经介绍了。
格式： grep + [option] + pattern + file/text

pattern ： 表示待查询的内容，可以是实际的内容（比如 cat 这个单词），也可以是一个正则表达式。

2.1、字符集和单词

符号	描述
. (句点)	用于匹配除换行符之外的任意一个字符。
[]	用于指定一个字符集。无论[]中有多少字符，在实际工作时都只能匹配一个字符。
\< \>	匹配字符串，开始和结束限定

注意事项：
1、这两个符号匹配的都是一个字符。
2、开始、结束限定的反斜杠千万不要写错了。

eg：

.at  : 表示匹配字符串中包含 at ，且 at 前面至少存在一个字符（换行符除外）
[a-z]at : 表示匹配字符串中包含 at ，且 at 前面存在一个a-z范围内的字符
[a-zA-Z]at : 表示匹配字符串中包含 at ，且 at 前面存在一个a-z或者A-Z范围内的字符
[abcdef]at : 表示匹配字符串中包含 at ，且 at 前面存在abcdef内的一个字符
/<[a-z]at/> : 匹配首字符是a-z范围内并且以at结尾的单词（该单词就三个字符）。

结果输出：
在这里插入图片描述

2.2、位置匹配

符号	描述
^	用于匹配行首（字符串的开始）
$	用于匹配行尾（字符串的结束）

注意事项：
1、^ 和 $ 可以同时使用，也可以分开使用。
2、^$ 表示输出空行；而$^没有任何意义，系统不会报错，但也不会输出内容。

eg：

^[0-9] : 表示所有以0-9数字开头的字符串
.t$ : 表示以 t 结尾的字符串
^[abc]t$ : 表示所有以abc内一个字符开头，t 结尾的字符串

结果输出：
在这里插入图片描述

2.3、字符类

除了字符集，POSIX风格的正则表达式还提供了预定义字符类来匹配某些特定的字符。

格式： grep “^[[:upper:]]t$” regexps.txt

blue：：匹配所有以大写字母开始，小写字母结尾的行。

字符类集合：

字符类	匹配字符
[[:alnum:]]	文字、数字字符
[[:alpha:]]	字母字符
[[:lower:]]	小写字母
[[:upper:]]	大写字母
[[:digit:]]	小数
[[:xdigit:]]	十六进制数字
[[:punct:]]	标点符号
[[:blank:]]	制表符和空格
[[:space:]]	空格
[[:cntrl:]]	所有控制符
[[:print:]]	所有可打印的字符
[[:graph:]]	除空格外的所有可打印字符

2.4、字符转义

我们前面介绍了 “.”（句点）表示的除换行符外的任意一个字符，那么我们在匹配“.”本身时，该怎么办呢？这是我们就需要用到转义字符 “\” (反斜杠) 了。

注意事项：
1、“\” 可以取消所有元字符的特殊含义。例如：“\.” 表示的是 “.” “\\”表示的是 “\” 等等。

2.5、字符重复出现

有时我们在匹配字符时希望某个字符重复出现（不止一次的出现），这时我们就可以使用” * “ 表示它前面的模式应该重复0次或者多次。

格式： grep “a.*t$” regexps.txt

解析： 匹配所有以 a 开头、以 t 结尾的行（中间的 " ." 表示出换行外的任意一个字符，" * " 表示 “.” 重复 0 次或者多次）。

用于表示模式的元字符：

字符类	匹配字符
*	重复 0 次或者多次
+	重复 1 次或者更多次
？	重复 0 次或者 1 次
{n}	重复 n 次
{n, }	重复 n 次或者更多次
{n, m }	重复不少于 n 次，或者不多于 m 次