概念

              在前面的文章中,我们知道元字符\b、^匹配的是一个位置,而且这个位置需要满足一些情

          况 。这样把满足这一条件称为断言或零宽度断言。下面看看正则表达式中常用的零宽度断言。

            

                 上一篇博客中也有提及:

           

               上述表达式同样也是匹配一个位置

     零宽度断言

               零宽度断言用于查找在某些内容之前或则之后的东西,用于指定一个位置,它声明一个为真的

               事实:正则表达式中只有断言为真的时候才继续匹配

      零宽度正预测先行断言

           (?=exp)匹配exp前面的位置。

             例子:[a-z]*(?=ing)可以匹配cooking和singing中的“cook”与“sing”

            

           tips:先行断言的执行步骤应该是从要匹配字符的最右端找到第一个“ing”,在匹配前面的

                表达式,如无法匹配则查找第二个“ing”,,类推....符合正则的贪婪性。

            

      零宽度正回顾后发断言

             (?<=exp)匹配exp后面的位置。

             例子:(?<=abc).*可以匹配abcdefgabc中的defgabc而不是abcdefg

           

           tips:通过比较很容易看出后发断言和先行断言正好相反:它先从要匹配的字符串的最左端

              进行查找断言表达式,之后匹配后面的字符串,如果无法匹配则继续查找第二个断言表达式

             如此反复...

           

       零宽度负预测先行断言

             (?!exp)匹配后面跟的不是exp的位置

           例子:(java)(?!(hello)):匹配java字符串,但是后面不能跟hello

           

      零宽度负回顾后发断言

            (?<!exp)匹配前面不是exp的位置

           例子:(?<!(java))(hello)匹配hello字符串但是前面不能有java

          

       练习

                例子1:

                      匹配不包含连续字符串"java"的单词:\b((?!(java))\w)+\b

          

               例子2:

                    匹配简单html标签中的内容:(?<=<(\w)>).*(?=<\/\1>)

                    

           好了关于断言就是这些了!