利用正则表达式将字符串分组处理

正则表达式在脚本语言中所起的作用是不言而喻的,熟练掌握正则表达式,对于每个脚本开发人员都至关重要,下面,我以近期工作中遇到的实际例子来介绍如何使用正则表达式在对字符串进行处理。

 

需求:

有一个字符串(如下所示),其特点是都多个[]括起,每个[]后用逗号隔开,结尾没有逗号,[]中的字符串也用逗号隔开

要求将此字符串以[]为单位分割成N个小数组。

 

 

处理的方法如下所示:

 

重点在于preg_match_all函数的第一个参数:模式

我们来看这个模式:

//[(.+?)/]/i

 

//i  是定界符(delimiter ),使用preg_match此类的函数一般都这么写,两个反斜杠//中间的部分为模式内容,i表示不区分大小写。

 

再来看这部分

/[(.+?)/]

由于方括号[]属于元字符,我们需要将其转义后才能匹配方括号[]本身。

 

注意了,方括号/[/]里面的这部分内容是重点中的重点,也是难点。

(.+?)

圆括号()表示把这里面的内容 .+? 作为一个整体放入内存中识别


点. 表示匹配一个除换行符以外的任意字符

 

下面来讲解最最重要的概念(当然是跟 +? 息息相关的了!):

贪婪与懒惰

当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多 的字符。以这个表达式为例:a.*b ,它将会匹配最长的以a开始,以b结束的字符串 。如果用它来搜索aabab 的话,它会匹配整个字符串aabab 。这被称为贪婪 匹配

 

有时,我们更需要懒惰 匹配 ,也就是匹配尽可能少 的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号? 。这样.*? 就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复 。现在看看懒惰版的例子吧:

a.*?b 匹配最短的,以a开始,以b结束的字符串 。如果把它应用于aabab 的话,它会匹配aab(第一到第三个字符)ab(第四到第五个字符)

 

为什么第一个匹配是aab(第一到第三个字符)而不是ab(第二到第三个字符)?简单地说,因为正则表达式有另一条规则,比懒惰/贪婪规则的优先级更高:最先开始的匹配拥有最高的优先权 ——The match that begins earliest wins。

 

下面给出懒惰限定符参考表(摘自《正则表达式30分钟入门教程》)

 

懒惰限定符
代码/语法说明
*? 重复任意次,但尽可能少重复
+? 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复

 

 

有的读者会问了,为什么点.后面跟的是加号+而不是星号*呢?

因为我们方括号[]里面是有内容的,如果修改为星号*,表示匹配前面表达式的0次~多次,即便方括号[]里面是空的,这样的也会被匹配到,当然这样的字符串不是我们需要的。

 

 

希望能通过这个例子,你对正则表达式有了更为深入的了解。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 使用 PHP 的正则表达式函数 preg_match() 可以匹配字符串。以下是一个示例: ```php $str = "Hello, World!"; $pattern = "/\bWorld\b/"; if (preg_match($pattern, $str)) { echo "Match found!"; } else { echo "Match not found."; } ``` 这段代码将输出 "Match found!",因为 $str 中包含单词 "World",并且 $pattern 中使用了单词边界 \b 进行匹配。请注意,正则表达式模式需要用斜杠 / 包围。 ### 回答2: PHP正则表达式是一种强大的字符串匹配工具,能够根据特定模式来匹配和处理字符串。在PHP中,可以使用preg_match函数来进行正则表达式的匹配。 preg_match函数接受三个参数,分别是正则表达式模式、目标字符串和可选的匹配结果输出变量。函数会在目标字符串中查找是否存在与正则表达式模式匹配的内容,如果匹配成功,则返回true,否则返回false。 正则表达式模式由特定的字符和符号组成,用于描述需要匹配的字符串规则。例如,使用\d可以匹配一个数字字符,\w可以匹配一个字母数字字符。 对于复杂的正则表达式模式,我们可以使用特定的字符类、量词和分组等特性来实现更准确的匹配。例如,使用[a-z]可以匹配一个小写字母,\d{2,4}可以匹配2到4个数字。 在进行匹配时,可以使用捕获组来提取感兴趣的部分字符串。捕获组是通过在正则表达式模式中使用小括号来定义的,使用圆括号包裹的部分将被定义为一个捕获组。 除了preg_match函数,PHP还提供了许多其他与正则表达式相关的函数,如preg_replace、preg_split等,用于替换、拆分和其他正则表达式操作。 总结来说,PHP正则表达式是一种强大的字符串匹配工具,可以根据特定的模式来匹配和处理字符串。在应用中,我们可以利用它来实现各种字符串操作,如验证、替换、拆分等。 ### 回答3: 在PHP中,正则表达式是一种强大的工具,用于匹配和处理字符串。它可以用于各种字符串操作,例如验证输入,提取数据以及替换特定的字符串。 使用正则表达式的基本步骤是: 1. 定义正则表达式模式,它由特定的字符和元字符组成,用于匹配目标字符串。 2. 使用preg_match函数进行匹配,该函数用于判断目标字符串是否与正则表达式模式匹配。如果匹配成功,则返回1;否则返回0。 3. 可以使用 preg_match_all函数来匹配目标字符串中的所有模式出现。 4. 使用preg_replace函数实现字符串中的替换操作,将匹配到的部分替换为指定的字符串。 5. 使用preg_split函数按照正则表达式模式分割字符串。 例如,如果我们想匹配一个字符串中是否包含数字,可以使用正则表达式模式"/\d/",其中\d表示数字。代码如下: ```php $str = "Hello,123 world"; if(preg_match("/\d/", $str)){ echo "字符串中包含了数字"; } else { echo "字符串中不包含数字"; } ``` 输出结果为:字符串中包含了数字。 以上是关于PHP正则表达式匹配字符串的基本操作,根据具体的需求和匹配规则,可以使用更复杂的模式和函数来实现更精确的匹配和处理

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值