Java中使用正则表达式的部分功能


正则表达式定义了字符串的模式。
正则表达式可以用来匹配、搜索、编辑或处理文本。

一个字符串其实就是一个简单的正则表达式,例如 Hello World 正则表达式匹配 “Hello World” 字符串。
.(点号)也是一个正则表达式,它匹配任何一个字符如:“a” 或 “1”。
java.util.regex 包主要包括以下三个类:Pattern,Matcher,PatternSyntaxException.

Pattern

pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数

String pattern = "String";
Pattern pattern = Pattern.compile(pattern)

pattern是给定的要匹配的模式

Matcher

Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。

Matcher matcher = pattern.matcher(message);

Mathcer常用的方法

Matcher.find():尝试查找与该模式匹配的输入序列的下一个子序列
Matcher.matches():尝试将整个输入序列与模式匹配。

Matcher的字符串替换方法:

序号方法及说明
1public Matcher appendReplacement(StringBuffer sb, String replacement)
实现非终端添加和替换步骤。
2public StringBuffer appendTail(StringBuffer sb)
实现终端添加和替换步骤。
3public String replaceAll(String replacement)
替换模式与给定替换字符串相匹配的输入序列的每个子序列。
4public String replaceFirst(String replacement)
替换模式与给定替换字符串匹配的输入序列的第一个子序列。
5public static String quoteReplacement(String s)
返回指定字符串的字面替换字符串。这个方法返回一个字符串,就像传递给Matcher类的appendReplacement 方法一个字面字符串一样工作。

捕获组

定义

捕获组是把多个字符当一个单独单元进行处理的方法,它通过对括号内的字符分组来创建。
例如,正则表达式 (dog) 创建了单一分组,组里包含"d",“o”,和"g"。
捕获组是通过从左至右计算其开括号来编号。例如,在表达式((A)(B(C))),有四个这样的组:
( ( A ) ( B ( C ) ) )
( A )
( B ( C ) )
( C )
可以通过调用 matcher 对象的 groupCount 方法来查看表达式有多少个分组。groupCount 方法返回一个 int 值,表示matcher对象当前有多个捕获组。

int count = matcher.groupCount();

matcher.groupCount()可以获取给定模式有多少个捕获组

还有一个特殊的组(group(0)),它总是代表整个表达式。该组不包括在 groupCount 的返回值中。

使用

String group1 = matcher.group(0);
//或者采用
String groupName = "";
String group2 = matcher.group(groupName);

实例:

static final String MASK = "***";
//给定指定模式,这3个模式都有3个捕获组
String pattern1 = "(\"password":")(.+?)(\")";
String pattern1 = "(\"encryptPassword\":\")(.+?)(\")";
String pattern1 = "(\"accessKey\":\")(.+?)(\")";
List<Pattern> patterns = new ArrayList<>();
patterns.add(pattern1);
patterns.add(pattern2);
patterns.add(pattern3);
//数据脱敏
public static String desensitized(String message){
        for (Pattern pattern : patterns){
            Matcher matcher = pattern.matcher(message);
            message = matcher.replaceAll("$1"+ MASK +"$3");
        }
        return message;
 }

其中replaceAll(String replaceString)方法的作用是:用给定的字符串替换原始字符串中,符合指定模式的子序列。
其中 $1,$3代表对应捕获组的引用。

"$1"+ MASK +"$3" == "password":"***"
//如果message中匹配上了("password":")(.+?)(")
//就使用"password":"***"来替换相关的子序列

先写到这,以后再补充!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值