PHP正则表达式_贪婪匹配与禁止贪婪匹配
什么是贪婪匹配呢?废话不多说,先看一段代码,如下:
$string='aaaaaaabbbbbbbbbbbbccccccc';
//如下
$pattern='/ab+/';
//或者说是如下
$pattern='/ab.+/';
preg_match($pattern, $string,$arr);
show($arr);
php正则表达式默认就是贪婪的 ,解决贪婪匹配的办法就是用 ? 号,所以阻止贪婪一般加? 来解决。
代码如下:
$string='aaaaaaabbbbbbbbbbbbccccccc';
//如下
$pattern='/ab+?/';
//或者说是如下
$pattern='/ab.+?/';
preg_match($pattern, $string,$arr);
show($arr);
+
案例1
这里跟加不加s 视为单行字符有关系, 因为加了s 视为单行以后会产生贪婪匹配、所以阻止贪婪后 在进行全局搜索匹配!
代码如下:
$string='test test http://www.163.com test test 百度
test test test 新浪';
//匹配网址
$pattern='/http:\/\/(ftp|www)\.\w+.(com|org|net)/';
//匹配href的内容 这里不加? 就会出现贪婪匹配
$pattern='/href="(.+?)"/s';
preg_match_all($pattern, $string,$arr);
show($arr);
+
案例2
删除某一个class文件中的所有注释 例如:Car.class.php文件,内容如下:
<?php /**
* @description
* @author 3#
*/interface Car{function run();
}/**
*
* @description 宝马车类
*
*/class Bmw implements Car{public function run(){echo '宝马车子在跑!!';
}
}/**
* @description 奔驰车类
*
*/class Bz implements Car{public function run(){echo '奔驰车子在跑!!';
}
}// $Bmw=new Bmw();// $Bmw->run();// echo '
';// $Bz=new Bz();// $Bz->run();?>
然后处理这个Car.class.php中的注释,把里面的注释都删掉。通常我们是如下处理的:
//载入文件
$file='./Car.class.php';
$content=file_get_contents($file);
//正则匹配
$pattern='/\/\*\*.*\*\//s';
//替换为空
$result=preg_replace($pattern, '', $content);
//最后把处理好的字符重新写入到文件中
file_put_contents($file, $result);
以上这样处理看似没什么问题,但是当你打开Car.class.php这个文件的时候你要大吃一惊的!! 现在Car.class.php里面应该只剩下 下面这个类了 其他的都不见了!!
class Bz implements Car{
public function run(){
echo '奔驰车子在跑!!';
}
}
原因
如果这样替换会产生如下情况: 原因是;贪婪匹配 .* 匹配了/* 开始一直到 */结尾、 中间无论什么内容都被视为 .* 的范畴之内了!
正确的做法是加上? 号 阻止贪婪匹配
解决贪婪匹配代码如下:
//载入文件
$file='./Car.class.php';
$content=file_get_contents($file);
//正则匹配 并且禁止贪婪
$pattern='/\/\*\*.*?\*\//s';
//替换为空
$result=preg_replace($pattern, '', $content);
//最后把处理好的字符重新写入到文件中
file_put_contents($file, $result);
结果Car.class.php文件中的注释就全部删除了 ,Car.class.php文件中的代码如下:
interface Car{
function run();
}
class Bmw implements Car{
public function run(){
echo '宝马车子在跑!!';
}
}
class Bz implements Car{
public function run(){
echo '奔驰车子在跑!!';
}
}
+
案例3
查找a出现1次到5次, 也包含之间的, 这种默认也是贪婪的,因为它会取出最大匹配的那一次,也就是5次。
代码如下:
$string='cbaaaaaa';
$pattern='/ba{1,5}/is';
preg_match($pattern, $string,$arr);
show($arr);
加上 ? 号 以后 就可以阻止贪婪匹配 并且取出最小匹配次数,代码如下:
$string='cbaaaaaa';
$pattern='/ba{1,5}?/is';
preg_match($pattern, $string,$arr);
show($arr);
小提示
??两个 问号就是完全取最小的
一个? 号表示取 0或者 1
两个?号就表示禁止贪婪 取完全最小值0,
+
案例4
案例中一个?号表示还是取了1个a ,但是两个??问号就一定没有a了 因为两个?? 号表示0、等同于这样写: /ba{0}/。代码如下:
$string='cbaaaaaa';
$pattern='/ba??/is';
preg_match($pattern, $string,$arr);
show($arr);
"点赞""评论""收藏"
大家的支持就是我坚持下去的动力!
如果以上内容有任何错误或者不准确的地方,
欢迎在下面 留个言指出、或者你有更好的想法,
欢迎一起交流学习
关注: 极客小俊 公众号 不定期分享技术干货
微信技术交流群 关注群主邀请进群