php preg_match 只匹配第一个字符_PHP正则表达式核心技术完全详解 第11节贪婪匹配与禁止贪婪

作者:极客小俊

一个专注于web技术的80后

你不用拼过聪明人,你只需要拼过那些懒人 你就一定会超越大部分人!


f745dd355ef6d8cb1bc25baef88eb4be.png

PHP正则表达式中的贪婪匹配与 (禁止贪婪)


贪婪匹配

什么是贪婪匹配呢? 废话不多说 先看一段代码案例把 如下:

 $string='aaaaaaabbbbbbbbbbbbccccccc'; //如下 $pattern='/ab+/'; //或者说是如下 $pattern='/ab.+/'; preg_match($pattern, $string,$arr); show($arr);

php正则表达式默认就是贪婪的 解决贪婪匹配 的办法就是用 ? 号 所以阻止贪婪一般加? 来解决 代码如下:

 $string='aaaaaaabbbbbbbbbbbbccccccc'; //如下 $pattern='/ab+?/'; //或者说是如下 $pattern='/ab.+?/'; preg_match($pattern, $string,$arr); show($arr);

小案例1: 这里跟加不加s 视为单行字符有关系, 因为加了s 视为单行以后会产生贪婪匹配、所以阻止贪婪后 在进行全局搜索匹配! 代码如下:

 $string='test test http://www.163.com test test 百度  test test test 新浪';  //匹配网址 $pattern='/http://(ftp|www).w+.(com|org|net)/'; //匹配href的内容  这里不加? 就会出现贪婪匹配 $pattern='/href="(.+?)"/s'; ​ preg_match_all($pattern, $string,$arr); show($arr); ​

小案例2: 删除某一个class文件中的所有注释 例如:Car.class.php文件 内容如下:

  <?php  ​ /**  * @description  * @author 3#  */ interface Car{     function run(); } ​ ​ /**  *   * @description 宝马车类  *  */ class Bmw implements Car{     public function run(){         echo '宝马车子在跑!!';     } } ​ ​ /**  * @description 奔驰车类  *  */ class Bz implements Car{     public function run(){         echo '奔驰车子在跑!!';     } } ​ ​ // $Bmw=new Bmw(); // $Bmw->run(); // echo '
'; // $Bz=new Bz(); // $Bz->run(); ​ ?>

然后处理这个Car.class.php中的注释,把里面的注释都删掉 通常我们是如下处理的

 //载入文件 $file='./Car.class.php'; $content=file_get_contents($file); //正则匹配 $pattern='//**.**//s'; //替换为空 $result=preg_replace($pattern, '', $content); //最后把处理好的字符重新写入带文件中 file_put_contents($file, $result);

以上这样处理看似没什么问题,但是当你打开Car.class.php这个文件的时候你要大吃一惊的!! 现在Car.class.php里面应该只剩下 下面这个类了 其他的都不见了!!

 class Bz implements Car{     public function run(){         echo '奔驰车子在跑!!';     } }

原因:如果这样替换会产生如下情况: 原因是;贪婪匹配 .* 匹配了/* 开始一直到 /结尾、 中间无论什么内容都被视为 . 的范畴之内了!

禁止贪婪

正确的做法是加上? 号 阻止贪婪匹配 代码如下:

 //载入文件 $file='./Car.class.php'; $content=file_get_contents($file); //正则匹配 并且禁止贪婪 $pattern='//**.*?*//s'; //替换为空 $result=preg_replace($pattern, '', $content); //最后把处理好的字符重新写入带文件中 file_put_contents($file, $result);

结果Car.class.php文件中的注释就全部删除了 ,Car.class.php文件中的代码如下:

 interface Car{     function run(); } ​ ​ ​ class Bmw implements Car{     public function run(){         echo '宝马车子在跑!!';     } } ​ ​ ​ class Bz implements Car{     public function run(){         echo '奔驰车子在跑!!';     } }

小案例3: 查找a出现1次到5次, 也包含之间的, 这种默认也是贪婪的,因为它会取出最大匹配的那一次! 也就是5次 如下代码:

$string='cbaaaaaa';$pattern='/ba{1,5}/is';preg_match($pattern, $string,$arr);show($arr);

加上 ? 号 以后 就可以阻止贪婪匹配 并且取出最小匹配次数 如下代码:

$string='cbaaaaaa';$pattern='/ba{1,5}?/is';preg_match($pattern, $string,$arr);show($arr);

小提示: ??两个 问号就是完全取最小的 一个? 号表示取 0或者 1 两个?号就表示禁止贪婪 取完全最小值0, 例如:案例中一个?号表示还是取了1个a ,但是两个??问号就一定没有a了 因为两个?? 号表示0、等同于这样写: /ba{0}/ 代码如下:

$string='cbaaaaaa';$pattern='/ba??/is';preg_match($pattern, $string,$arr);show($arr);

ec29c4ca16b624c6e73b03483c9878c4.png
02ae52e56728fb19a6aa4a394e6ba564.gif
d9f13b5cd2b67a7cb7884316111596d0.gif

极客小俊@今日头条,首发原创文章

如果喜欢话请 "点赞 评论 收藏" 一键三连

大家的支持就是我坚持下去的动力!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值