linux运维中正则表达式的使用

骤雨__

于 2023-03-22 14:08:39 发布

阅读量193

点赞数

文章标签： linux 运维正则表达式

本文链接：https://blog.csdn.net/qq_41759305/article/details/129708475

版权

正则表达式在Linux运维中的应用非常广泛，比如文本处理、文件搜索、日志分析等等。以下是几个常见的例子：

查找所有以.txt结尾的文件：

ls | grep '\.txt

解释：ls 命令列出当前目录下的所有文件和文件夹，| 表示将结果传递给 grep 命令，\ 表示转义字符，. 表示匹配任意字符，txt 表示匹配字符 “txt”，$ 表示以 “txt” 结尾。

查找所有包含关键字 “error” 的日志：

cat logfile | grep 'error'

解释：cat 命令将文件内容输出到终端，| 表示将结果传递给 grep 命令，'error' 表示要查找的关键字。

替换文件中的某个字符串：

sed -i 's/old_string/new_string/g' file.txt

解释：sed 命令用于对文本进行替换操作，-i 表示直接修改原始文件，s/old_string/new_string/g 表示将文件中的 “old_string” 替换为 “new_string”，g 表示全局替换。

查找所有以数字开头的文件夹：

ls -d [0-9]*/

解释：ls 命令列出当前目录下的所有文件和文件夹，-d 表示只列出文件夹，[0-9] 表示匹配任意数字，*/ 表示匹配以斜杠结尾的文件夹名称。

统计某个文件夹下的所有文件数量：

ls -1 | wc -l

解释：ls 命令列出当前目录下的所有文件和文件夹，-1 表示每行只列出一个文件名，| 表示将结果传递给 wc 命令，-l 表示统计行数。

1. 在文本中查找包含多个关键字的行：

grep 'keyword1\|keyword2' file.txt

解释：grep 命令用于在文本中查找包含关键字的行，\| 表示逻辑或，keyword1 和 keyword2 是要查找的关键字。

查找某个进程的 PID：

ps aux | grep 'process_name'

解释：ps 命令用于显示当前进程状态，aux 表示显示所有进程，| 表示将结果传递给 grep 命令，'process_name' 是要查找的进程名。

ls -t | head -n 1

解释：ls 命令列出当前目录下的所有文件和文件夹，-t 表示按照修改时间排序，| 表示将结果传递给 head 命令，-n 1 表示只显示第一行结果。

查找某个进程使用的端口：

lsof -i :port_number

解释：lsof 命令用于显示当前系统打开的文件和网络连接，-i 表示只显示网络连接，:port_number 是要查找的端口号。

find . -type f -size 0

解释：find 命令用于查找文件和目录，. 表示当前目录，-type f 表示只查找文件，-size 0 表示查找大小为 0 的文件。

使用反向引用

反向引用是指在正则表达式中引用前面匹配到的子表达式，可以在替换中使用，简化替换过程。例如，将日期格式从"YYYY/MM/DD"转换为"DD.MM.YYYY"，可以使用以下命令：

echo "2021/03/21" | sed 's/\([0-9]\{4\}\)\/\([0-9]\{2\}\)\/\([0-9]\{2\}\)/\3.\2.\1/g'

其中，“[0−9]{4}[0-9]{4}[0−9]{4}”、“[0−9]{2}[0-9]{2}[0−9]{2}”、"[0−9]{2}[0-9]{2}[0−9]{2}"分别匹配年、月、日，并使用反向引用的方式在替换中进行位置调整。

使用零宽度断言

零宽度断言是指匹配位置而不匹配字符本身，可以在查找和替换中用于复杂的逻辑条件。例如，查找以"2021"开头的行，但不包含"2021-01"和"2021-02"开头的行，可以使用以下命令：

grep '^2021\(-03\|-04\|-05\|-06\|-07\|-08\|-09\|-10\|-11\|-12\)\?

其中，“−03∥−04∥−05∥−06∥−07∥−08∥−09∥−10∥−11∥−12-03|-04|-05|-06|-07|-08|-09|-10|-11|-12−03∥−04∥−05∥−06∥−07∥−08∥−09∥−10∥−11∥−12?“使用零宽度断言，匹配"2021"后面跟着”-03"到”-12"之间的月份，但不匹配"2021-01"和"2021-02"。

使用捕获组

捕获组是指将匹配到的字符保存到变量中，可以在替换中使用。例如，替换文本中的所有URL为链接，可以使用以下命令：

echo "This is a URL: http://www.example.com" | sed -E 's#(https?|ftp)://([^/:]+)(:[0-9]+)?(/[^/]+)*#\0 (\1://\2) #g'

其中，(https?|ftp)://([^/:]+)(:[0-9]+)?(/[^/]+)*是一个捕获组，匹配URL并将其保存到变量"\0"中，同时也保存了"http"或"https"或"ftp"等协议到变量"\1"中，域名到变量"\2"中。然后使用替换的方式将URL替换为链接文本。

这些都是正则表达式在Linux运维中的高级用法，可以让我们更高效地进行文本处理和日志分析。

1. 使用字符类和量词

字符类是指匹配一组字符中的任意一个字符，可以使用方括号"[]“表示。量词是指匹配前面字符出现的次数，例如”*“表示0个或多个，”+“表示1个或多个，”?"表示0个或1个。字符类和量词可以组合使用，用于匹配复杂的文本格式。例如，匹配包含IP地址的行可以使用以下命令：

grep -E '([0-9]{1,3}\.){3}[0-9]{1,3}' filename

其中，"([0-9]{1,3}.){3}“表示匹配三个数字和一个点号的组合，”{1,3}“表示数字可以出现1次、2次或3次，”[0-9]{1,3}"表示匹配一个1到3位的数字。

使用模式空间和保持空间

模式空间是指sed命令处理的当前行，保持空间是指sed命令缓存的额外行，可以使用模式空间和保持空间来实现复杂的文本处理和转换。例如，将文件中所有单词转换为大写，可以使用以下命令：

sed 's/\b\([a-z]\+\)\b/\U\1/g' filename

其中，“\b"表示单词边界，”[a−z]+[a-z]+[a−z]+“表示匹配一个或多个小写字母，”\U\1"表示将捕获组中的内容转换为大写。

使用贪婪模式和非贪婪模式

贪婪模式是指尽可能匹配更多的字符，非贪婪模式是指尽可能匹配更少的字符。在使用量词时，通常默认使用贪婪模式。但在某些情况下，需要使用非贪婪模式，例如匹配HTML标签中的内容，可以使用以下命令：

grep -Po '<[^>]+?>\K[^<]+' filename

其中，<[^>]+?>表示匹配一个HTML标签，\K表示忽略前面匹配的内容，[^<]+表示匹配标签后面的文本内容。

骤雨__

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫