五、分组语法
捕获语法
(exp) 匹配exp,并捕获文本到自动命名的组里;
(?exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name’exp);
(?:exp) 匹配exp,不捕获匹配的文本,也不给此分组分配组号;
在之前表示ip地址时候已经涉及过分组的使用,即: ==(\d{1,3}.){3}\d{1,3} == ,这是第一种的用法,即是使用了自动命名的组。默认情况下,每个分组会自动拥有一个组号,规则是:从左向右,以分组的左括号为标志,第一个出现的分组的组号为1,第二个为2,以此类推。比如说是: ((\d){3}\d(\d){5}){2} ,在这种情况下,最外层的括号,即重复两次的分组为1,往内重复三次的括号为2组,剩下的组号为3。
并且额外的, 需注意 :
1、分组0对应整个正则表达式
2、从微观来看,组号分配过程是要从左向右扫描两遍的:第一遍只给未命名组分配,第二遍只给命名组分配--因此所有命名组的组号都大于未命名的组号
3、可以使用(?:exp)这样的语法来剥夺一个分组对组号分配的参与权.
后向引用
后向引用用于重复搜索前面某个分组匹配的文本。比如: \b(\w+)\b\s+\1\b ,‘(