文章目录
前言
正则表达式,又称规则表达式。(英语:Regular Expression),在代码中常简写为 regex、regexp 或 RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本,正则表达式不只有一种,而且 Linux 中不同的程序可能会使用不同的正则表达式,如:支持的工具:grep sed awk egrep
一、概述
- 通常用于判断语句中,用来检查某一 字符串是否满足某一格式
- 正则表达式是由普通字符与元字符组成
- 普通字符包括大小写字母、数字、标点符号及一些其他符号
- 元字符是指在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式
Linux 中常用的有两种正则表达式引擎
基础正则表达式:BRE
扩展正则表达式: ERE
二、基础正则表达式常见元字符
- 支持的工具: grep、egrep、sed、awk
常见元字符 | 解释 |
---|---|
\ | 转义字符,去除其后紧跟的元字符或通配符的特殊意义,例: !、\n、$等 |
^ | 匹配字符串开始的位置,除非在方括号表达式中使用,表示不包含该字符集合。要匹配“^” 字符本身,请使用“^” |
$ | 匹配字符串结束的位置,如果设置了RegExp 对象的 Multiline 属性,则“KaTeX parse error: Undefined control sequence: \n at position 6: ”也匹配‘\̲n̲’或‘\r’。要匹配“”字符本身,请使用“$” |
. | 匹配除\n之外的任意的一一个字符,例:go.d、g…d |
* | 匹配前面子表达式0次或者多次,要匹配“”字符,请使用“*”,例: goo*d、 go.*d |
[list] | 匹配list列表中的一个字符,例 |