主要是对正则的相关符号进行说明,此处的相关文本匹配指的是单行匹配
正则相关符号
- 正则表达式的符号包括
. * [] ^ $ {} \ + ? | ()
- 转义字符 \
- 脱字符 ^ :用来锁定文本行开头位置。如果把该符号放在字符串的中间,则它就变成了一个普通的字符
- 美元符 $:用来锁定文本行结尾为止。同理,它也只有放在文本的末端才会产生匹配作用
- 点符号 . :用来匹配任意的单字符,除了换行符。如果在该符号的位置没有任何字符,那么模式就不会成立
- 字符组 [ ] :用来制定文本行中某个位置只能出现的字符
- 排除字符组 [^ ]:用来排除文本行中某个位置不能出现的字符
- 使用区间 - :制定文本行中某个位置职能出现的字符,配合字符组的使用,它表示一组连续的值。如[a-c],表示匹配模式[abc];[a-ch-j],表示[abchij]
- 星号 * :该位置可以出现任意字符零次或者多次
BRE正则的特殊字符组
扩展的正则表达式
- 问号 ?:表示匹配前一个字符零次或者多次
- 加号 + :表示匹配前一个字符一次或者多次
- 花括号 { } :指定正则匹配的次数
- {m}——表示前面的模式准确出现m次
- {m.n}——表示前面的模式至少出现m次,至多出现n次
- 管道符号 | :允许用or的方式指定正则引擎需要匹配的两个或者多个模式
- 聚合():将多个字符组合成一个整体,用作普通自负进行匹配