<?php
/*--------------------------------------正则表达式--------------------------*/
★ preg_filter — 执行一个正则表达式搜索和替换
★ preg_grep — 返回匹配模式的数组条目
★ preg_last_error — 返回最后一个PCRE正则执行产生的错误代码
★ preg_match_all — 执行一个全局正则表达式匹配
★ preg_match(string $pattern , string $subject ) — 执行一个正则表达式匹配
★ preg_quote — 转义正则表达式字符
★ preg_replace_callback — 执行一个正则表达式搜索并且使用一个回调进行替换
★ preg_replace — 执行一个正则表达式的搜索和替换
★ preg_split — 通过一个正则表达式分隔字符串
正则表达式的语法规则
1 定界符
2 原子
原子是正则表达式的最基本的组成单元,而且在每个模式中最少要少包含一个原子。原子是由所有那些未显示指定为元字符的打印和非打印字符组成,具体分为5类。
1. 普通字符作为原子:
a~z、A~Z、0~9
2. 一些特殊字符和转义后元字符作为原子:
所有标点符号,但语句特殊意义的符号需要转义后才可作为原子,如:\” \’ \* \+ \? \. 等
3. 一些非打印字符作为原子: 如:\f \n \r \t \v \cx
\cx 匹配由x指明的控制字符。如\cM匹配一个Control-M或回车符。x的值必须为A~Z或a~z之一。
\f 匹配一个换页符。等价于 \x0c或\cL
\n 匹配一个换行符。等价于 \x0a或\cJ
\r 匹配一个回车符。等价于 \x0d或\cM
\t 匹配一个制表符。等价于 \x09或\cI
\v 匹配一个垂直制表符。等价于 \x0b或\cK
4. 使用“通用字符类型”作为原子:如:\d \D \w \W \s \S。
\d 匹配任意一个十进制数字,等价于[0-9]
\D 匹配任意一个除十进制数字以外的字符,等价于[^0-9]
\s 匹配任意一个空白符,等价于[\f\n\r\t\v]
\S 匹配除空白符以外任何字符,等价于[^\f\n\r\t\v]
\w 匹配任意一个数字、字母或下画线,等价于[0-9a-zA-Z_]
\W 匹配一个除数字、字母或下画线以外的任意一个字符,等价于[^0-9a-zA-Z_]
5. 自定义原子表([])作为原子:如:’/[apj]sp/’ ’/[^apj]sp/’
▼ 重复匹配
* 匹配0次、1次或多次其前的原子 任意次
+ 匹配1次或多次其前的原子 一次以上{1,}
? 匹配0次或1次其前的原子
▼ 匹配除换行符外任何一个字符
. 匹配除了换行符外的任意一个字符
▼ 模式选择符
| 匹配两个或多个分支选择
▼ 重复匹配:元字符
{n} 表示其前面的原子恰好出现n次
{n,} 表示其前面的原子出现不小于n次
{n,m} 表示其前面的原子至少出现n次,最多出现m次
▼ 字符串边界限制
^或\A 匹配输入字符串的开始位置(或在多行模式下行的开头,即紧随一个换行符之后)
$或\Z 匹配输入字符串的结束位置(或在多行模式下行的结尾,即紧随一个换行符之前)
▼ 单词边界限制
\b 匹配单词的边界
\B 匹配除单词边界以外的部分
▼ 原子表 -方括号表达式
[] 匹配方括号中指定的任意一个原子
[^] 匹配除方括号中的原子以外的任意一个字符
[-] 用于连接一组按ASCII码顺序排列的原子,简化书写
▼ 模式单元
( ) 匹配其整体为一个原子,即模式单元。可以理解为由多个单个原子组成的大原子
重新使用的模式单元:\\2 \2
系统自动将模式单元“()”中的匹配依次存储起来,在需要时可以用“\1”、“\2”、“\3”的形式进行引用。当正则表达式包含有相同的模式单元时,这种方法非常便于对其进行管理。注意使用时需要写成“\\1”、“\\2”
3 元字符
4 模式修正符
i 在和模式进行匹配时不区分大小写
g 表示全局匹配
m 将字符串视为多行。默认的正则开始“^”和结束“$”将目标字符串作为单一的一“行”字符。加上m后,那么开始 和结束将会指字符串的每一行。
s 如果设定了此修正符,模式中的圆点元字符'.'匹配所有的字符,包括换行符。即将字符串视为单行,换行符作为普通字 符看待
x 模式中的空白忽略不计,除非它已经被转义
e 只用在preg_replace()函数中,在替换字符串中对逆向引用做正常的替换,将其作为 php代码求值,并用其结果来替换所搜索的字符串。
U 本修正符反转了匹配数量的值使其不是默认的重复,而变成在后面跟上“?”才变得重复。这和 Perl 不兼容。也可以通过在模式之中设定 (U) 修正符或者在数量符之后跟一个问号(如启.*?)来用此选项。
D 模式中的美元元字符仅匹配目标字符串的结尾。没有此选项时,如果最后一个字符是换行符的话,美元符号也会匹配此 字符之前。如果设定了 m 修正符则忽略此选项
A 强制从目标字符串开头匹配;
邮箱正则:
preg_match("/^\w+@\w+\.\w+$/", $_POST['email'])
ip正则:
preg_match("/^(([1-9]|([1-9]\d)|(1\d\d)|(2([0-4]\d|5[0-5])))\.)((d|([1-9]\d)|(1\d\d)|(2([0-4]\d|5[0-5])))\.){2}([1-9]|([1-9]\d)|(1\d\d)|(2([0-4]\d|5[0-5])))$/",$ip)
php注释正则:
区块:"/\/\*(\s|.)*\*\//U" /* */
单行:"/\/\//" //
PHP 正则
最新推荐文章于 2022-11-26 15:37:30 发布