正则表达式截取指定字符串间的字符串

最新推荐文章于 2024-06-25 18:03:42 发布

二十九画生d

最新推荐文章于 2024-06-25 18:03:42 发布

阅读量3w

点赞数 7

分类专栏：正则表达式文章标签： java

本文链接：https://blog.csdn.net/qq_33230345/article/details/104992725

版权

正则表达式专栏收录该内容

1 篇文章 0 订阅

订阅专栏

当对一段无规则的长本文进行指定内容的获取或提取时，运用正则表达式可以有效的提升我们的代码质量，提高我们的代码效率；

最近开发的功能极致的发挥了正则表达式的作用，且用到了多种截取方式。故在此做下总结与记录，希望可以帮到看到此博客的人。

1.截取指定字符串之间的字符串（不含开头与结尾字符串）

在一段文本中，我们指定了固定格式的文本。比如：

a=@${*||名称:NAME||input}

b=@${*||备注:REMARK||input}

我们要对整段文本中固定格式间（此处为‘@${’ 与 ‘}’ 之间）的内容进行提取，则可以用如下正则：

 (?<=\\@\\$\\{)(.+?)(?=\\})

完整代码如下：

String pat = "(?<=\\@\\$\\{)(.+?)(?=\\})";
Pattern pattern = Pattern.compile(pat);
Matcher m = pattern.matcher(你要进行提取的文本内容);
while (m.find()) {
    int i = 1;
    System.out.println(m.group(i));
    i++;
}

得到结果就为：

*||名称:NAME||input
*||备注:REMARK||input

2.截取字符串之间的字符串（含开头与结尾字符）

还是在上述的一段文本中，或许我们要进行提取的这段文本中含有换行符，而正则表达式中的 ‘ . ’ 表示除换行符\n之外的任意字符,因此按照上述正则，对有换行的文本提取时便会失效。比如：

…
######杂七杂八的#########
…

``{||这儿是一段文本内容||内容 文本

换行的

文本}``

``{||示例||****}``

……………………
……

如上图所示，我们要截取 ``{ 与 }`` 之间的内容（包含开头结尾），而且此段文本中还包含换行。那么，在此处，我们可以用如下正则：

(?=\``\{)([\s\S]*?)(?<=\}\``)

完整代码如下：

String rule = "(?=\\``\\{)([\\s\\S]*?)(?<=\\}\\``)";
Pattern patter = Pattern.compile(rule);
Matcher matcher = patter.matcher(你要识别并从中提取内容的文本);
        while (matcher.find()) {
            int i = 1;
            System.out.println(matcher.group(i));
            i++;
}

执行代码得到的结果为：

``{||这儿是一段文本内容||内容文本

换行的

文本}``

``{||示例||****}``

综上，正则表达式解析先说这么多，时间关系，在前端代码中运用到的场景并详细做出说明。