Hutool之正则表达式工具类——ReUtil

前言

在文本处理中,正则表达式几乎是全能的,但是Java的正则表达式有时候处理一些事情还是有些繁琐,所以我封装了部分常用功能。就比如说我要匹配一段文本中的某些部分,我们需要这样做:

<!-- lang: java -->
Pattern pattern = Pattern.compile(regex, Pattern.DOTALL);
Matcher matcher = pattern.matcher(content);
if (matcher.find()) {
    String result= matcher.group();
}

其中牵涉到多个对象,想用的时候真心记不住。好吧,既然功能如此常用,我就封装一下:

<!-- lang: java -->
/**
* 获得匹配的字符串
* 
* [@param](https://my.oschina.net/u/2303379) pattern 编译后的正则模式
* [@param](https://my.oschina.net/u/2303379) content 被匹配的内容
* [@param](https://my.oschina.net/u/2303379) groupIndex 匹配正则的分组序号
* [@return](https://my.oschina.net/u/556800) 匹配后得到的字符串,未匹配返回null
*/
public static String get(Pattern pattern, String content, int groupIndex) {
    Matcher matcher = pattern.matcher(content);
    if (matcher.find()) {
        return matcher.group(groupIndex);
    }
    return null;
}

/**
* 获得匹配的字符串
* 
* [@param](https://my.oschina.net/u/2303379) regex 匹配的正则
* @param content 被匹配的内容
* @param groupIndex 匹配正则的分组序号
* @return 匹配后得到的字符串,未匹配返回null
*/
public static String get(String regex, String content, int groupIndex) {
    Pattern pattern = Pattern.compile(regex, Pattern.DOTALL);
    return get(pattern, content, groupIndex);
}

其他方法介绍

其他方法我做了一个Demo类,方便大家参考,地址:

https://gitee.com/loolly/hutool/blob/v4-master/hutool-core/src/main/java/cn/hutool/core/util/ReUtil.java

Demo代码

<!-- lang: java -->
package com.xiaoleilu.hutool.demo;

import java.util.ArrayList;
import java.util.List;

import org.slf4j.Logger;

import com.xiaoleilu.hutool.Log;
import com.xiaoleilu.hutool.ReUtil;

/**
 * 正则表达式工具类Demo
 * @author Looly
 *
 */
public class ReUtilDemo {
    private final static Logger log = Log.get();
    
    public static void main(String[] args) {
        String content = "ZZZaaabbbccc中文1234";
        
        //get demo 正则查找匹配的第一个字符串
        String resultGet = ReUtil.get("\\w{2}", content, 0);
        log.debug("get: {}", resultGet);
        
        log.debug("---------------------------------------------------------");
        
        //抽取多个分组然后把它们拼接起来
        String resultExtractMulti = ReUtil.extractMulti("(\\w)aa(\\w)", content, "$1-$2");
        log.debug("extractMulti: {}", resultExtractMulti);
        
        log.debug("---------------------------------------------------------");
        
        //抽取多个分组然后把原文匹配到位置之前的内容都删除
        String[] contents = new String[]{content};
        String resultExtractMultiAndDelPre = ReUtil.extractMultiAndDelPre("(\\w)aa(\\w)", contents, "$1-$2");
        log.debug("extractMultiAndDelPre: content: {}, extract: {}", contents[0], resultExtractMultiAndDelPre);
        
        log.debug("---------------------------------------------------------");
        
        //删除第一个匹配到的内容
        String resultDelFirst = ReUtil.delFirst("(\\w)aa(\\w)", content);
        log.debug("delFirst: {}", resultDelFirst);
        
        log.debug("---------------------------------------------------------");
        
        //删除第一个匹配到的内容以及之前的文本
        String resultDelPre = ReUtil.delPre("(\\w)aa(\\w)", content);
        log.debug("delPre: {}", resultDelPre);
        
        log.debug("---------------------------------------------------------");
        
        //查找所有匹配文本
        List<String> resultFindAll = ReUtil.findAll("\\w{2}", content, 0, new ArrayList<String>());
        log.debug("findAll: {}", resultFindAll);
        
        log.debug("---------------------------------------------------------");
        
        //找到匹配的第一个数字
        Integer resultGetFirstNumber= ReUtil.getFirstNumber(content);
        log.debug("getFirstNumber: {}", resultGetFirstNumber);
        
        log.debug("---------------------------------------------------------");
        
        //格式是否符合Ipv4格式
        log.debug("isIpv4: {}", ReUtil.isIpv4("127.0.0.1"));
        
        log.debug("---------------------------------------------------------");
        
        //给定字符串是否匹配给定正则
        log.debug("isMatch: {}", ReUtil.isMatch("\\w+[\u4E00-\u9FFF]+\\d+", content));
        
        log.debug("---------------------------------------------------------");
        
        //通过正则查找到字符串,然后把匹配到的字符串加入到replacementTemplate中,$1表示分组1的字符串
        log.debug("replaceAll: {}", ReUtil.replaceAll(content, "(\\d+)", "->$1<-"));
        
        log.debug("---------------------------------------------------------");
        
        //转义给定字符串,为正则相关的特殊符号转义
        log.debug("replaceAll: {}", ReUtil.escape("我有个$符号{}"));
        
        log.debug("---------------------------------------------------------");
    }
}

我的项目地址:

转载于:https://my.oschina.net/looly/blog/312057

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Hutool 是一个 Java 工具类库,其中包含了很多常用的工具类和方法,包括正则表达式相关的工具类Hutool 中的正则表达式工具类是 `ReUtil`,使用它可以方便地进行正则表达式的匹配和提取。 下面是一些常用的正则表达式方法: 1. `isMatch(String regex, CharSequence content)`:判断 content 是否与 regex 匹配。 2. `removeAll(String regex, CharSequence content)`:替换 content 中所有匹配的字符串。 3. `replaceAll(String regex, String replacement, CharSequence content)`:替换 content 中第一个匹配的字符串。 4. `replaceFirst(String regex, String replacement, CharSequence content)`:替换 content 中所有匹配的字符串。 5. `findAll(String regex, CharSequence content)`:查找 content 中所有匹配的字符串。 6. `get(String regex, CharSequence content, int group)`:提取 content 中第 group 组匹配的字符串。 示例代码: ```java import cn.hutool.core.util.ReUtil; public class RegexTest { public static void main(String[] args) { String content = "Hello, I am a Java developer."; // 判断是否匹配 boolean isMatch = ReUtil.isMatch("\\w+\\s\\w+", content); System.out.println(isMatch); // true // 替换所有匹配的字符串 String replaced = ReUtil.removeAll("\\w+", content); System.out.println(replaced); // ", a ." // 替换第一个匹配的字符串 String replacedFirst = ReUtil.replaceFirst("\\w+", "Java", content); System.out.println(replacedFirst); // "Java, I am a Java developer." // 替换所有匹配的字符串 String replacedAll = ReUtil.replaceAll("\\w+", "Java", content); System.out.println(replacedAll); // "Java, Java Java Java." // 查找所有匹配的字符串 String[] found = ReUtil.findAll("\\w+", content, 0).toArray(new String[0]); System.out.println(Arrays.toString(found)); // ["Hello", "I", "am", "a", "Java", "developer"] // 提取第一组匹配的字符串 String group1 = ReUtil.get("(\\w+),", content, 1); System.out.println(group1); // "Hello" } } ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值