Java正则环视和反向引用

版权声明:【分享也是一种提高】个人转载请在正文开头明显位置注明出处,未经作者同意禁止企业/组织转载,禁止私自更改原文,禁止用于商业目的。 https://blog.csdn.net/u010887744/article/details/73823228
==环视==
1、环视概念
环视,又称为零宽断言,简称断言。
环视强调位置(前面或后面),必须匹配环视表达式,才能匹配成功。
环视可认为是虚拟加入到它所在位置的附加判断条件,并不消耗正则的匹配字符。

2、环视基础表达式
(?=Expression) 顺序肯定环视,表示所在位置右侧能够匹配Expression
(?!Expression) 顺序否定环视,表示所在位置右侧不能匹配Expression
(?<=Expression) 逆序肯定环视,表示所在位置左侧能够匹配Expression
(?<!Expression) 逆序否定环视,表示所在位置左侧不能匹配Expression
Note:顺序(=)右侧匹配,逆序环视比顺序环视多了个<
JavaScript中只支持顺序环视,不支持逆序环视。
Java中虽然顺序环视和逆序环视都支持,但是逆序环视只支持长度确定的表达式,逆序环视中量词只支持?,不支持其它长度不定的量词。

3、使用示例
3.1、顺序肯定环视(?=Expression)
3.1.1、匹配后缀结尾是“.txt”的不含后缀的文件名
【.+(?=\.txt)】
文本:
txtfile.txt
exefile.exe
inifile.ini
匹配结果:txtfile

3.1.2、匹配密码(必须包含字母(不区分大小写)、数字,6-16位)
【^(?=.*?[a-zA-Z])(?=.*?[0-9])[a-zA-Z0-9]{6,16}$】
(?=.*?[a-zA-Z]) 限定后面的字符中至少有一个字母,使用 (?=.*?[0-9]) 限定后面的字符中至少有一个数字,最后通过实际匹配正则 [a-zA-Z0-9]{6,16} 限定量词。

3.2、顺序否定环视(?!Expression)
3.2.1、匹配除<a></a>之外的标签
【<(?!/?a\b)[^<]+?>】
文本:<a><a1></a>zxiaofan<div>com</d>iv>cc
匹配结果:
<a1>
<div>
</d>

3.2.2、匹配后缀结尾不是“.txt”的含后缀的文件名
【.+(?!\.txt)】表达式错误,因为.+没有指定位置且是贪婪匹配。(因此.+就能直接匹配txtfile.txt了
【(.+)(?!\.txt)\.[^.]+$】
文本:
txtfile.txt
exefile.exe
inifile.ini
匹配结果:
exefile.exe
inifile.ini

3.3、逆序肯定环视(?<=Expression)
3.3.1、匹配指定标签之间的内容
【(?<=<div>)[^<]+(?=</div>)】
文本:<div>zxiaofan.com</div>
匹配结果:zxiaofan.com

3.3.2、获取指定参数的值
(?<=name=).+
文本:
name=zxiaofan
age=20
level=6
匹配结果:zxiaofan

3.4、逆序否定环视(?<!Expression)
3.4.1、获取非指定参数的值
【^[^=#]+=(?<!name=).+$】
文本:
name=zxiaofan
age=20
level=6
#sex=1
匹配结果:
age=20
level=6

4、综合示例
4.1、必须包含字母、数字、特殊字符
【^(?=.*?[a-zA-Z])(?=.*?\d)(?![a-zA-Z\d]+$).+$】
解释:^(?=.*?[a-zA-Z])限制必须有字母;(?=.*?\d)限制必须有数字;(?![a-zA-Z\d]+$)限制不能全为数字和字母。

4.2、匹配主域名(匹配顶级域名)
【(?<=(?:://\w{0,50}\.)?)(?:\w{0,50}\.)(?:com\.cn|net\.cn|org\.cn|com|net|org|cn|biz|info|cc|tv)】
文本:
vip.zxiaofan.com.cn
http://zxiaofan.com/123
www.zxiaofan.org.cn
匹配结果:
zxiaofan.com.cn
zxiaofan.com
zxiaofan.org.cn

Note:【?:】不捕获匹配的文本到自动命名的组,也不给此组分配组好。(去掉后不影响结果)
特殊域名:万网www.net.cn

4.3、匹配5连号手机号码
【1[34578]\d{3}(\d)(?!\1{1})(\d)\2{4}】
文本:
18328501111
18328511111
18328551111
18328111111
匹配结果:
18328511111

Note1:\1匹配第一组内容
Note2:(?!\1{1})过滤6连号的号码

==反向引用==
1、反向引用概念
捕获组:按照()子表达式划分成若干组;每出现一对()就是一个捕获组;引擎会对捕获组进行编号,编号规则是左括号(从左到右出现的顺序,从1开始编号。
捕获组命名:
(?<name>exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp);
(?:exp) 匹配exp,不捕获匹配的文本到自动命名的组,也不给此分组分配组号。
反向引用:
\1表示第一组(abc);\2表示第二组;
\k<Word>:引用指定名字的组。

2、使用示例
2.1、匹配首尾相同的文件名
【([a-z]{3})[a-z]+\.\1{1}】
文本:
txtfile.txt
exefile.txt
fileini.ini
匹配结果:
txtfile.txt
Note:([a-z]{3})为第一组,\1{1}表示引用第一组一次(这里不能写成\1{3})。

欢迎个人转载,但须在文章页面明显位置给出原文连接;
未经作者同意必须保留此段声明、不得随意修改原文、不得用于商业用途,否则保留追究法律责任的权利。

【 CSDN 】:csdn.zxiaofan.com
【GitHub】:github.zxiaofan.com

如有任何问题,欢迎留言。祝君好运!
Life is all about choices! 
将来的你一定会感激现在拼命的自己!

没有更多推荐了,返回首页