Shell脚本学习-正则表达式&&grep
一、基本概念
正则表达式:规定一些特殊语法表示字符类、数量限定符和位置限定符,然后用这些特殊语法和普通字符一起表示一个模式。
正则表达式的三要素:
(1)字符类
(2)数量限定符
(3)位置限定符
grep为行过滤器,正则表达式在grep中用来查找符合模式的字符串。根据正则表达式中的关键字,将当行中的所有符合要求的匹配。
二、字符类
字符
|
含义
|
举例
|
.
| 匹配任意一个字符 | abc.可以匹配abcd、abc9等 |
[ ]
| 匹配括号中的任意一个字符 | [ abc ]d可以匹配ad、bd、cd |
-
| 在[ ]括号内表示字符的范围 | [ 0-9a-fA-F ]可以匹配以为十六进制数字 |
^
| 在[ ]括号内的开头,匹配除括号中的字符之外的任意字符 |
[ ^xy ]匹配除xy之外的任一字符,
[ ^xy ]可以匹配a1、b1
但不能匹配x1,y1
|
[ [ : xxx : ] ]
| grep工具预定义的一些命名字符类 |
[ [ : alpha : ] ]匹配一个字母
[ [ : digit : ] ]匹配一个数字
|
(1)字符 . :匹配任意一个字符。
(2)字符 [ ]:匹配括号中的任意一个字符
(3)字符 -:在[ ]括号内表示字符的范围
(4)字符 ^:在[ ]括号内的开头,匹配除括号中的字符之外的任意字符
三、数量限定符
字符
|
含义
|
?
|
紧跟在它前面的单元应匹配零次或一次
|
+
|
紧跟在它前面的单元应匹配一次或多次
|
*
|
紧跟在它前面的单元应匹配零次或多次
|
{N}
|
紧跟在它前面的单元精确匹配N次
|
{N,}
|
紧跟在它前面的单元匹配至少N次
|
{N,M}
|
紧跟在它前面的单元应匹配至少N次,最多M次
|
(1)字符 ?:紧跟在它前面的单元应匹配零次或一次
(2)字符 +:紧跟在它前面的单元应匹配一次或多次
(3)字符 *:紧跟在它前面的单元应匹配零次或多次
(4)字符 {N}:紧跟在它前面的单元精确匹配N次
(5)字符 {N, }:紧跟在它前面的单元匹配至少N次
(6)字符 {N,M}:紧跟在它前面的单元应匹配至少N次,最多M次
四、位置限定符
字符
|
含义
|
^
| 匹配行首的位置 |
$
| 匹配行末的位置 |
\<
| 匹配单词开头的位置 |
\>
| 匹配单词结尾的位置 |
\b
| 匹配单词开头或结尾的位置 |
\B
| 匹配非单词开头和结尾的位置 |
(1)字符 ^:匹配行首的位置
(2)字符 $:匹配行末的位置
(3)字符 \<:匹配单词开头的位置
(4)字符 \>:匹配单词结尾的位置
(5)字符 \b:匹配单词开头或结尾的位置
(6)字符 \B:匹配非单词开头和结尾的位置
五、其他特殊字符
字符
|
含义
|
\
| 转义字符,普通字符转义为特殊字符,特殊字符转义为普通字符 |
( )
| 将正则表达式的一部分括起来组成一个单元,可以对整个单元使用数量限定符 |
|
| 连接两个子表达式,表示或的关系 |
grep的扩展模式
常用的grep选项有:
-c 只输出匹配行的计数。
-i 不区分大小写(只适用于单字符)。
-h 查询多文件时不显示文件名。
-l 查询多文件时只输出包含匹配字符的文件名。
-n 显示匹配行及行号。
-s 不显示不存在或无匹配文本的错误信息。
-c 只输出匹配行的计数。
-i 不区分大小写(只适用于单字符)。
-h 查询多文件时不显示文件名。
-l 查询多文件时只输出包含匹配字符的文件名。
-n 显示匹配行及行号。
-s 不显示不存在或无匹配文本的错误信息。
-v 显示不包含匹配文本的所有行。
-q 安静
应用:
1.查找正确的电话号码
2.找正确的邮箱及电话