文本三剑客--grep和正则表达式

最新推荐文章于 2024-07-13 11:17:31 发布

我不道啊；

最新推荐文章于 2024-07-13 11:17:31 发布

阅读量84

点赞数 2

文章标签：正则表达式 linux 运维

本文链接：https://blog.csdn.net/2301_78106979/article/details/132264904

版权

一、grep:

grep命令是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。

格式： grep [选项]… 查找条件目标文件

-i 默认，忽略大小写
-n 显示匹配的行号
-c 只统计匹配的行数
-v 取反，显示搜索之外
-m   多个匹配，可以限定显示的行数
-o 仅显示匹配到的字符串
-A 后跟数字，表示匹配到内容行后，在向下显示几行
-B 后跟数字，表示匹配到内容行后，再向上显示几行
-C 后跟数字，表示匹配到内容行后，在现实上下几行
-e 逻辑“或”，可以匹配多个条件，实现多个选项间的逻辑关系，可以跟多个条件
-w   表示匹配整个单词
-E   表示使用扩展正则表达式，egrep，也可以使用扩展正则表达式
-f 对2个文件内容进行匹配，打印匹配出2个文件相同的内容
-r 递归目录，不处理软连接
-R   递归目录，处理软连接

示例：

二、正则表达式：

REGEXP： Regular Expressions，由一类特殊字符及文本字符所编写的模式，其中有些字符（元字符）不表示字符字面意义，而表示控制或通配的功能，类似于增强版的通配符功能，但与通配符不同，通配符功能是用来处理文件名，而正则表达式是处理文本内容中字符。

正则表达式被很多程序和开发语言所广泛支持：vim, less,grep,sed,awk, nginx,mysql 等

主要用来匹配字符串（命令结果，文本内容），

通配符匹配文件（而且是已存在的文件）

基本正则表达式
扩展正则表达式

1.元字符：

.	匹配任意单个字符，可以是一个汉字
[ ]	匹配指定范围内的任意单个字符
[^]	匹配指定范围外的任意单个字符
[:alnum:]	字母和数字
[:alpha:]	代表任何英文大小写字符，相当于 A-Z, a-z
[:lower:]	小写字母
[:upper:]	大写字母
[:blank:]	空白字符
[:space:]	包括空格、制表符(水平和垂直)、换行符、回车符等各种类型的空白
[:graph:]	可打印的非空白字符
[:print:]	可打印字符
[:punct:]	标点符号
\w	匹配单词构成部分，等价于[_[:alnum:]]
\W	匹配非单词构成部分，等价于[^_[:alnum:]]
\S	匹配任何非空白字符。
\s	匹配任何空白字符，包括空格、制表符、换页符等等


例：
ls /etc/ | grep "rc[.0-6]"
#表示匹配以rc开头，任意单个字符，0-6的数字

2.表示次数：

*	匹配前面的字符任意次，包括0次
.*	任意长度的任意字符,不包括0次
\?	匹配其前面的字符出现0次或1次,即:可有可无
\+	匹配其前面的字符出现最少1次,即:肯定有且 >=1 次
\{n\}	匹配前面的字符n次
\{m,n\}	匹配前面的字符至少m次，至多n次
\{,n\}	匹配前面的字符至多n次,<=n
\{n,\}	匹配前面的字符至少n次

3.位置锚定：

^
$
^root$
^$
^[[:space:]]*$
\broot	词首锚定，用于单词模式的左侧 (连续的数字，字母，下划线都算单词内部)
123\b	词尾锚定，用于单词模式的右侧
\<PATTERN\>	匹配整个单词

4.分组：

分组：() 将多个字符捆绑在一起，当作一个整体处理，如：(root)+

\ | 表示或者

5.扩展正则表达式：

* 匹配前面的字符任意次，0次也可以，有多少匹配多少。贪婪模式
.* 匹配任意长度的字符，至少一次，不包括0次
? 匹配前面的字符0次或者1次，可有可无
+ 匹配前面的字符，至少1次
{n} 匹配前面的字符，只能匹配n次
{m,n} 匹配前面的字符，最多匹配n次，最少匹配m次
{,n} 匹配前面的字符，最多n次
{n,} 匹配前面的字符，最少n次