正则表达式

无名花火

于 2019-02-23 22:43:27 发布

阅读量103

点赞数

分类专栏：正则文章标签：正则资料整理

本文链接：https://blog.csdn.net/mutou_ren123/article/details/87898339

版权

正则专栏收录该内容

1 篇文章 0 订阅

订阅专栏

正则表达式简介:
正则表达式是用于描述字符排列和匹配模式的一种语法规则.它主要用于字符串的模式分割、匹配、查找及替换操作.

正则表达式的语法规则
正则表达式作为一个匹配的模版,是由原子(普通字符,例如字符a到z)、特殊字符(元字符,例如*、+和？等)、以及模式修正符三部分组成的文字模式.

原子:
1. 普通字符作为原子：如 a~z、A~Z、0~9 等
2. 一些特殊字符和转义后元字符作为原子：
所有标点符号，但语句特殊意义的符号需要转义后才可作为原子，如：\” \’ \* \+ \? \. 等
3. 一些非打印字符作为原子：如：\f \n \r \t \v \cx
4. 使用“通用字符类型”作为原子：如：\d \D \w \W \s \S。
5. 自定义原子表([])作为原子：如：’/[apj]sp/’ ’/[^apj]sp/’

正则表达式中常用的“通用字符类型”:
\d   匹配任意一个十进制数字，等价于[0-9]
\D   匹配任意一个除十进制数字以外的字符，等价于[^0-9]
\s   匹配任意一个空白符，等价于[\f\n\r\t\v]
\S   匹配除空白符以外任何字符，等价于[^\f\n\r\t\v]
\w   匹配任意一个数字、字母或下画线，等价于[0-9a-zA-Z_]
\W   匹配一个除数字、字母或下画线以外的任意一个字符，等价于[^0-9a-zA-Z_]

正则表达式中常用的非打印字符
\cx   匹配由x指明的控制字符。如\cM匹配一个Control-M或回车符。x的值必须为A~Z或a~z之一。
\f   匹配一个换页符。等价于 \x0c或\cL
\n   匹配一个换行符。等价于 \x0a或\cJ
\r   匹配一个回车符。等价于 \x0d或\cM
\t   匹配一个制表符。等价于 \x09或\cI
\v   匹配一个垂直制表符。等价于 \x0b或\cK

元字符
*   匹配0次、1次或多次其前的原子
+   匹配1次或多次其前的原子
？   匹配0次或1次其前的原子
.   匹配除了换行符外的任意一个字符
|   匹配两个或多个分支选择
{n}   表示其前面的原子恰好出现n次
{n,}表示其前面的原子出现不小于n次
{n,m}表示其前面的原子至少出现n次，最多出现m次
^或\A匹配输入字符串的开始位置（或在多行模式下行的开头，即紧随一个换行符之后）
$或\Z匹配输入字符串的结束位置（或在多行模式下行的结尾，即紧随一个换行符之前）
\b   匹配单词的边界
\B   匹配除单词边界以外的部分
[]   匹配方括号中指定的任意一个原子
[^]   匹配除方括号中的原子以外的任意一个字符
( )   匹配其整体为一个原子，即模式单元。可以理解为由多个单个原子组成的大原子

系统自动将模式单元“（）”中的匹配依次存储起来，在需要时可以用“\1”、“\2”、“\3”的形式进行引用。当正则表达式包含有相同的模式单元时，这种方法非常便于对其进行管理。注意使用时需要写成“\\1”、“\\2”
当不需要存储匹配结果时使用非存储模式单元“（？：）”

模式匹配的优先级
1   \   转义字符
2   () (?:) (?=) []   模式单元和原子表
3   * + ? {n} {n,} {n,m}   重复匹配
4   ^ $ \b \B \A \Z   边界限制
5   |   模式选择

模式修正符
i   在和模式进行匹配时不区分大小写
m   将字符串视为多行。默认的正则开始“^”和结束“$”将目标字符串作为单一的一“行”字符。加上m后，那么开始和结束将会指字符串的每一行。
s   如果设定了此修正符，模式中的圆点元字符“.”匹配所有的字符，包括换行符。即将字符串视为单行，换行符作为普通字符看待
x   模式中的空白忽略不计，除非它已经被转义
e   只用在preg_replace()函数中，在替换字符串中对逆向引用做正常的替换，将其作为 PHP 代码求值，并用其结果来替换所搜索的字符串。
U   本修正符反转了匹配数量的值使其不是默认的重复，而变成在后面跟上“?”才变得重复。这和 Perl 不兼容。也可以通过在模式之中设定 (U) 修正符或者在数量符之后跟一个问号（如启.*?）来用此选项。
D   模式中的美元元字符仅匹配目标字符串的结尾。没有此选项时，如果最后一个字符是换行符的话，美元符号也会匹配此字符之前。如果设定了 m 修正符则忽略此选项

Perl语言兼容的正则表达式处理函数
preg_match()   进行正则表达式匹配
preg_match_all()   进行全局正则表达式匹配
preg_replace()   执行正则表达式的搜索和替换
preg_split()   用正则表达式分割字符串
preg_grep()   返回与模式匹配的数组单元
preg_replace_callback   用回调函数执行正则表达式的搜索和替换

无名花火

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式

正则表达式简介:正则表达式是用于描述字符排列和匹配模式的一种语法规则.它主要用于字符串的模式分割、匹配、查找及替换操作.正则表达式的语法规则正则表达式作为一个匹配的模版,是由原子(普通字符,例如字符a到z)、特殊字符(元字符,例如*、+和？等)、以及模式修正符三部分组成的文字模式.原子:1. 普通字符作为原子：如 a~z、A~Z、0~9 等2. 一些特殊字符和转义后元字符作为原子...
复制链接

扫一扫

专栏目录