正则表达式中的符号和preg_match()

. 	匹配除换行符以外的任意字符
\w 	匹配字母或数字或下划线或汉字
\s 	匹配任意的空白符
\d 	匹配数字
\b 	匹配单词的开始或结束
^ 	匹配字符串的开始
$ 	匹配字符串的结束
[\u4e00-\u9fa5]{2,20} 匹配2-20个汉字

* 	重复零次或更多次
+ 	重复一次或更多次
? 	重复零次或一次
{n} 	重复n次
{n,} 	重复n次或更多次
{n,m} 	重复n到m次

\W 	匹配任意不是字母,数字,下划线,汉字的字符
\S 	匹配任意不是空白符的字符
\D 	匹配任意非数字的字符
\B 	匹配不是单词开头或结束的位置
[^x] 	匹配除了x以外的任意字符
[^aeiou] 	匹配除了aeiou这几个字母以外的任意字符

(exp) 	匹配exp,并捕获文本到自动命名的组里
(?<name>exp) 	匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)
(?:exp) 	匹配exp,不捕获匹配的文本,也不给此分组分配组号
零宽断言
(?=exp) 	匹配exp前面的位置
(?<=exp) 	匹配exp后面的位置
(?!exp) 	匹配后面跟的不是exp的位置
(?<!exp) 	匹配前面不是exp的位置
注释
(?#comment) 	这种类型的组不对正则表达式的处理产生任何影响,用于提供注释让人阅读

 
 

preg_match

(PHP 4, PHP 5)

preg_match — 执行一个正则表达式匹配

reject note 说明

int  preg_match (  string $pattern ,  string $subject [,  array &$matches [,  int $flags = 0 [,  int $offset = 0 ]]] )

搜索subjectpattern给定的正则表达式的一个匹配.

reject note 参数

pattern

要搜索的模式, 字符串类型.

subject

输入字符串.

matches

如果提供了参数matches, 它讲被填充为搜索结果. $matches[0]将包含完整模式匹配到的文本, $matches[1] 将包含第一个捕获子组匹配到的文本, 以此类推.

flags

flags可以被设置为以下标记值:

PREG_OFFSET_CAPTURE
如果传递了这个标记, 对于每一个出现的匹配返回时会附加字符串偏移量(相对于目标字符串的). 注意: 这会改变填充到matches参数的数组, 使其每个元素成为一个由 第0个元素是匹配到的字符串, 第1个元素是该匹配字符串 在目标字符串subject中的偏移量.

offset

通常, 搜索从目标字符串的开始未知开始.可选参数offset用于 指定从目标字符串的某个未知开始搜索(单位是字节).

Note:

使用offset参数不同于向 preg_match() 传递按照位置通过substr($subject, $offset)截取目标字符串结果, 因为pattern可以包含断言比如^$ 或者(?<=x). 比较:

<?php $subject "abcdef"; $pattern '/^def/'; preg_match($pattern$subject$matchesPREG_OFFSET_CAPTURE3); print_r($matches); ?>

以上例程会输出:

Array
(
)

当这个示例使用截取后传递时

<?php
$subject 
"abcdef";
$pattern '/^def/';
preg_match($patternsubstr($subject,3), $matchesPREG_OFFSET_CAPTURE);
print_r($matches);
?>

将会产生匹配

Array
(
    [0] => Array
        (
            [0] => def
            [1] => 0
        )

)

reject note 返回值

preg_match()返回pattern的匹配次数. 它的值将是0次(不匹配)或1次, 因为 preg_match()在第一次匹配后 将会停止搜索.preg_match_all()不同于此, 它会一直搜索subject 直到到达结尾. 如果发生错误 preg_match()返回FALSE.

reject note 更新日志

版本说明
5.2.2命名子组可以接受(?<name>)(?'name') 以及(?P<name>)语法. 之前版本仅接受(?P<name>)语法.
4.3.3增加了参数offset.
4.3.0增加了标记PREG_OFFSET_CAPTURE.
4.3.0增加了参数flags.

reject note 范例

Example #1 查找文本字符串"php"

<?php
//模式分隔符后的"i"标记这是一个大小写不敏感的搜索
if (preg_match("/php/i""PHP is the web scripting language of choice.")) {
    echo 
"A match was found.";
} else {
    echo 
"A match was not found.";
}
?>

Example #2 查找单词"word"

<?php
/* 模式中的\b标记一个单词边界, 所以只有独立的单词"web"会被匹配, 而不会匹配
 * 单词的部分内容比如"webbing" 或 "cobweb" */
if (preg_match("/\bweb\b/i""PHP is the web scripting language of choice.")) {
    echo 
"A match was found.";
} else {
    echo 
"A match was not found.";
}

if (
preg_match("/\bweb\b/i""PHP is the website scripting language of choice.")) {
    echo 
"A match was found.";
} else {
    echo 
"A match was not found.";
}
?>

Example #3 获取URL中的域名

<?php
//从URL中获取主机名称
preg_match('@^(?:http://)?([^/]+)@i',
    
"http://www.php.net/index.html"$matches);
$host $matches[1];

//获取主机名称的后面两部分
preg_match('/[^.]+\.[^.]+$/'$host$matches);
echo 
"domain name is: {$matches[0]}\n";
?>

以上例程会输出:

domain name is: php.net

Example #4 使用命名子组

<?php

$str 
'foobar: 2008';

preg_match('/(?P<name>\w+): (?P<digit>\d+)/'$str$matches);

/* 下面例子在php 5.2.2(pcre 7.0)或更新版本下工作, 然而, 为了后向兼容, 上面的方式是推荐写法. */
// preg_match('/(?<name>\w+): (?<digit>\d+)/', $str, $matches);

print_r($matches);

?>

以上例程会输出:

Array
(
    [0] => foobar: 2008
    [name] => foobar
    [1] => foobar
    [digit] => 2008
    [2] => 2008
)

reject note 注释

Tip

如果你仅仅想要检查一个字符串是否包含另外一个字符串, 不要使用 preg_match(). 使用 strpos()或 strstr()替代完成工作会更快.

reject note 参见


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值