当对一段无规则的长本文进行指定内容的获取或提取时,运用正则表达式可以有效的提升我们的代码质量,提高我们的代码效率;
最近开发的功能极致的发挥了正则表达式的作用,且用到了多种截取方式。故在此做下总结与记录,希望可以帮到看到此博客的人。
1.截取指定字符串之间的字符串(不含开头与结尾字符串)
在一段文本中,我们指定了固定格式的文本。比如:
a=@${*||名称:NAME||input}
b=@${*||备注:REMARK||input}
我们要对整段文本中固定格式间(此处为‘@${’ 与 ‘}’ 之间)的内容进行提取,则可以用如下正则:
(?<=\\@\\$\\{)(.+?)(?=\\})
完整代码如下:
String pat = "(?<=\\@\\$\\{)(.+?)(?=\\})";
Pattern pattern = Pattern.compile(pat);
Matcher m = pattern.matcher(你要进行提取的文本内容);
while (m.find()) {
int i = 1;
System.out.println(m.group(i));
i++;
}
得到结果就为:
*||名称:NAME||input
*||备注:REMARK||input
2.截取字符串之间的字符串(含开头与结尾字符)
还是在上述的一段文本中,或许我们要进行提取的这段文本中含有换行符,而正则表达式中的 ‘ . ’ 表示除换行符\n之外的任意字符,因此按照上述正则,对有换行的文本提取时便会失效。比如:
…
######杂七杂八的#########
…
``{||这儿是一段文本内容||内容 文本
换行的
文本}``
``{||示例||****}``
……………………
……
如上图所示,我们要截取 ``{ 与 }`` 之间的内容(包含开头结尾),而且此段文本中还包含换行。那么,在此处,我们可以用如下正则:
(?=\``\{)([\s\S]*?)(?<=\}\``)
完整代码如下:
String rule = "(?=\\``\\{)([\\s\\S]*?)(?<=\\}\\``)";
Pattern patter = Pattern.compile(rule);
Matcher matcher = patter.matcher(你要识别并从中提取内容的文本);
while (matcher.find()) {
int i = 1;
System.out.println(matcher.group(i));
i++;
}
执行代码得到的结果为:
``{||这儿是一段文本内容||内容 文本
换行的
文本}``
``{||示例||****}``
综上,正则表达式解析先说这么多,时间关系,在前端代码中运用到的场景并详细做出说明。