本次将结束这个系列,最后一篇文章。相对而言,嵌入条件在正则表达式中使用很少,甚至很多语言不支持嵌入条件这种写法,不过最为了解,本章讲简短说明一下嵌入条件在正则表达式中如何使用。嵌入条件的表达式按照书上的说明是这样的:
?(backer-ference)true-regex|false-regex
我们这里举一个例子,建设匹配美国的电话号码的例子:
123-456-7890
(123)456-7890
(123-456-7890
1234567890
123 456 7890
按照一般写法,我们可以写出一下的正则表达式来匹配电话号码
\(?\d{3}\)?-?\d{3}-\d{4}
按照上面的表达式,第三个(123-456-7890将会匹配到,而很明显的是:这个电话号码的括号没有成对出现,因此它不是一个正确的电话号码格式。这个时候就是嵌入条件出场的时候了。按照前面说的语法,就得出以下的表达式
(\()?\d{3}(?(1)\)|-)\d{3}-\d{4}
这里面有一个重要的子表达式,我们把它单独拿出来说明一下:
(?(1)\)|-)
假设第一个子表达式(就是前半个括号“(\()”)存在的话,那么接下来应该匹配后半边括号,如果不是括号,那么应该匹配“-”号。相当于一个if else。这里我们用伪代码来说明一下这个表达式的含义
if(第1个子表达式=="(")
{
查找")"
}
else
{
查找"-"
}
所以通过最后这个表达式就刚好可以匹配想要的结果,既只有前2个是正确的电话号码。