BASH万用字符_BASH特殊字符_正则表达式元字符

最新推荐文章于 2022-04-19 10:53:11 发布

izhixin

最新推荐文章于 2022-04-19 10:53:11 发布

阅读量1.1k

点赞数 1

分类专栏： linux基本操作命令文章标签：正则表达式

本文链接：https://blog.csdn.net/hanwm_engineer/article/details/79352403

版权

linux基本操作命令专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1、名字解释

正则表达式：是对字符串（包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”））操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式，模式描述在搜索文本时要匹配的一个或多个字符串。支持正则表达式的工具：vi，sed，awk，grep。“正则表达式与万用字符是完全不一样的东西！” 因为“万用字符（wildcard）代表的是 bash 操作接口的一个功能”，但正则表达式则是一种字串处理的表示方式！“正则表达式的特殊字符”与一般在命令行输入指令的“万用字符”并不相同。

BASH(GNU Bourne-Again Shell) ：是许多Linux发行版的默认Shell。

2、常见字符整理

BASH万用字符

符号	意义
*	代表“ 0 个到无穷多个”任意字符
?	代表“一定有一个”任意字符
[ ]	同样代表“一定有一个在括号内”的字符（非任意字符）。例如 [abcd] 代表“一定有一个字符，可能是 a, b, c, d 这四个任何一个”
[ - ]	若有减号在中括号内时，代表“在编码顺序内的所有字符”。例如 [0-9] 代表 0 到 9 之间的所有数字，因为数字的语系编码是连续的！
[^ ]	若中括号内的第一个字符为指数符号（^），那表示“反向选择”，例如 [^abc] 代表一定有一个字符，只要是非 a, b, c 的其他字符就接受的意思。

BASH特殊字符

符号	内容
#	注解符号：这个最常被使用在 script 当中，视为说明！在后的数据均不执行
\	跳脱符号：将“特殊字符或万用字符”还原成一般字符
\|	管线（pipe）：分隔两个管线命令的界定（后两节介绍）；
;	连续指令下达分隔符号：连续性命令的界定（注意！与管线命令并不相同）
~	使用者的主文件夹
$	取用变量前置字符：亦即是变量之前需要加的变量取代值
&	工作控制（job control）：将指令变成背景下工作
!	逻辑运算意义上的“非” not 的意思！
/	目录符号：路径分隔的符号
>, >>	数据流重导向：输出导向，分别是“取代”与“累加”
<, <<	数据流重导向：输入导向（这两个留待下节介绍）
' '	单引号，不具有变量置换的功能（$ 变为纯文本）
" "	具有变量置换的功能！（$ 可保留相关功能）

`	两个“ ` ”中间为可以先执行的指令，亦可使用 $（）
（）	在中间为子 shell 的起始与结束
{ }	在中间为命令区块的组合！

基础正则表达式元字符

RE 字符	意义与范例
^word	意义：待搜寻的字串（word）在行首！范例：搜寻行首为 # 开始的那一行，并列出行号。 grep -n '^#' regular_express.txt
word$	意义：待搜寻的字串（word）在行尾！范例：将行尾为 ! 的那一行打印出来，并列出行号。 grep -n '!$' regular_express.txt
.	意义：代表“一定有一个任意字符”的字符！范例：搜寻的字串可以是（eve）（eae）（eee）（e e），但不能仅有（ee）！亦即 e 与 e 中间“一定”仅有一个字符，而空白字符也是字符！ grep -n 'e.e' regular_express.txt
\	意义：跳脱字符，将特殊符号的特殊意义去除！范例：搜寻含有单引号 ' 的那一行！ grep -n \' regular_express.txt
*	意义：重复零个到无穷多个的前一个 RE 字符范例：找出含有（es）（ess）（esss）等等的字串，注意，因为可以是 0 个，所以 es 也是符合带搜寻字串。另外，因为为重复“前一个 RE 字符”的符号，因此，在之前必须要紧接着一个 RE 字符喔！例如任意字符则为 “.” ！ grep -n 'ess*' regular_express.txt
[list]	意义：字符集合的 RE 字符，里面列出想要撷取的字符！范例：搜寻含有（gl）或（gd）的那一行，需要特别留意的是，在 [] 当中“谨代表一个待搜寻的字符”，例如“ a[afl]y ”代表搜寻的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f或 l 的意思！ grep -n 'g[ld]' regular_express.txt
[n1- n2]	意义：字符集合的 RE 字符，里面列出想要撷取的字符范围！范例：搜寻含有任意数字的那一行！需特别留意，在字符集合 [] 中的减号 - 是有特殊意义的，他代表两个字符之间的所有连续字符！但这个连续与否与 ASCII 编码有关，因此，你的编码需要设置正确（在 bash 当中，需要确定 LANG 与 LANGUAGE的变量是否正确！）例如所有大写字符则为 [ A-Z ] grep -n '[A-Z]' regular_express.txt
[^list]	意义：字符集合的 RE 字符，里面列出不要的字串或范围！范例：搜寻的字串可以是（oog）（ood）但不能是（oot），那个 ^ 在 [] 内时，代表的意义是“反向选择”的意思。例如，我不要大写字符，则为 [^A-Z]。但是，需要特别注意的是，如果以 grep -n [^A-Z] regular_express.txt 来搜寻，却发现该文件内的所有行都被列出，为什么？因为这个 [^A-Z] 是“非大写字符”的意思，因为每一行均有非大写字符，例如第一行的 "Open Source" 就有 p,e,n,o.... 等等的小写字 grep -n 'oo[^t]' regular_express.txt
{n,m}	意义：连续 n 到 m 个的“前一个 RE 字符” 意义：若为 {n} 则是连续 n 个的前一个 RE 字符，意义：若是 {n,} 则是连续 n 个以上的前一个 RE 字符！范例：在g 与 g 之间有 2 个到 3 个的 o 存在的字串，亦即（goog）（gooog ) grep -n 'go\{2,3\}g' regular_express.txt

扩展正则表达式增加的元字符

RE字符	意义与范例
+	意义：重复“一个或一个以上”的前一个 RE 字符范例：搜寻（god）（good）（goood） ... 等等的字串。那个 o+ 代表“一个以上的 o ”所以，下面的执行成果会将第 1, 9, 13 行列出来。 egrep -n 'go+d' regular_express.txt
?	意义：“零个或一个”的前一个 RE 字符范例：搜寻（gd）（god）这两个字串。那个 o? 代表“空的或 1 个 o ”所以，上面的执行成果会将第 13, 14 行列出来。有没有发现到，这两个案例（'go+d' 与 'go?d' ）的结果集合与 'go*d' 相同？想想看，这是为什么喔！ egrep -n 'go?d' regular_express.txt
\|	意义：用或（or ）的方式找出数个字串范例：搜寻 gd 或 good 这两个字串，注意，是“或”！所以，第 1,9,14 这三行都可以被打印出来喔！那如果还想要找出dog 呢？ egrep -n 'gd\|good' regular_express.txt > egrep -n 'gd\|good\|dog' regular_express.txt
（）	意义：找出“群组”字串范例：搜寻（glad）或（good）这两个字串，因为 g 与d 是重复的，所以，我就可以将 la 与 oo 列于（）当中，并以 \| 来分隔开来，就可以啦！ egrep -n 'g（la\|oo） d' regular_express.txt
（） +	意义：多个重复群组的判别范例：将“AxyzxyzxyzxyzC”用 echo 叫出，然后再使用如下的方法搜寻一下！ echo 'AxyzxyzxyzxyzC' \| egrep 'A（xyz） +C'

特殊符号

特殊符号	代表意义
[:alnum:]	代表英文大小写字符及数字，亦即 0-9, A-Z, a-z
[:alpha:]	代表任何英文大小写字符，亦即 A-Z, a-z
[:blank:]	代表空白键与 [Tab] 按键两者
[:cntrl:]	代表键盘上面的控制按键，亦即包括 CR, LF, Tab, Del.. 等等
[:digit:]	代表数字而已，亦即 0-9
[:graph:]	除了空白字符（空白键与 [Tab] 按键）外的其他所有按键
[:lower:]	代表小写字符，亦即 a-z
[:print:]	代表任何可以被打印出来的字符
[:punct:]	代表标点符号（punctuation symbol），亦即：" ' ? ! ; : # $...
[:upper:]	代表大写字符，亦即 A-Z
[:space:]	任何会产生空白的字符，包括空白键, [Tab], CR 等等
[:xdigit:]	代表 16 进位的数字类型，因此包括： 0-9, A-F, a-f 的数字与字符

3、egrep元字符总结

3.1、匹配单个字符的元字符

. 点号匹配单个任意字符

[…] 字符组匹配单个列出的字符

[^…] 排除型字符组匹配单个未列出的字符

\char 转义字符若char是元字符,或转义序列无特殊含义时,匹配char对应的普通字符

3.2、提供计数功能的元字符

? 问号容许匹配一次,但非必须

* 星号可以匹配任意多次,也可能不匹配

+ 加号至少需要匹配一次,至多可能任意多次

{min,max} 区间量词至少需要min次,至多容许max次

3.3、匹配位置的元字符

^ 脱字符匹配一行的开头位置

$ 美元符匹配一行的结束位置

\< 单词分界符匹配单词的开始位置

\> 单词分界符匹配单词的结束位置

3.4、其他元字符

| alternation 匹配任意分隔的表达式

(…) 括号限定多选结构的范围,标注量词作用的元素,为反向引用”捕获”文本

\1,\2,… 反向引用匹配之前的第一、第二组括号内的字表达式匹配的文本

使用括号的3个理由：限制多选结构、分组、捕获文本

3.5、转义有3种情况：

1. \ 加上元字符，表示匹配元字符所使用的普通字符。

2. \ 加上非元字符，组成一种由具体实现方式规定其意义的元字符序列如\<表示单词的起始边界。

3. \ 加上任意其他字符，默认情况就是匹配此字符，也就是说，反斜线被忽略了。

4、示例

4.1、找出当前目录先所有的a开头的文件

ls | egrep --color '^a.*'

4.2、找出/etc/passwd文件里所有root开头的行

egrep --color '^root' /etc/passwd

4.3、找出/etc/issue文件里除了空白行和以“#”开头行的所有行

egrep --color -v '^$|^#' /etc/issue

4.4、找出本机IP地址

以eth0为例
只打印所在的行：ifconfig eth0 | grep "inet addr:"
只打印ip：ifconfig eth0 | grep "inet addr:"|awk -F: '{print $2}'|awk -F' ' '{print $1}'

        ifconfig |sed -n 's#^.*r:$.*$ Bc.*$#\1#gp'
                简单说明一下：
            sed 's###g' 这个是基础表达式
            -n 取消默认输出
            ^.*r:表示在r:之前所有内容
            \是转义字符
            $ .*\）表示所选内容
            Bc.*$表示在Bc之后所有内容
            \1 表示前面小括号里面的内容
            P 表示打印输出
          ifconfig |sed -n 's#^.*r:\(.*$ B.*t:$.*$ Ma.*$#\1\t\2#gp' 这是同时输入 IP 和电子掩码的命令。

izhixin

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
BASH万用字符_BASH特殊字符_正则表达式元字符

1、名字解释正则表达式：是对字符串（包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”））操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式，模式描述在搜索文本时要匹配的一个或多个字符串。支持正则表达式的工具：vi，sed，awk，grep。“正则表达式...
复制链接

扫一扫