正则表达式一个问号引发的血案

起因

一个java进程,通过top命令查看到其CPU使用量400%多(八核CPU),于是通过进程查线程,再通过线程查询调用堆栈发现是Java的replaceAll方法在消耗CPU,再具体一点就是Java的正则表达式处理在消耗大量CPU
进程查线程,查堆栈信息看这里 Linux中找出Java程序占用大量CPU的元凶

堆栈信息如下

java.lang.Thread.state: RUNABBLE
	at java.util.regex.Pattern$Curly.match1(Pattern.java:4300)
	at java.util.regex.Pattern$Curly.match(Pattern.java:4236)
	at java.util.regex.Pattern$start.match1(Pattern.java:3461)
	at java.util.regex.Matcher.search(Matcher.java:1248)
	at java.util.regex.Matcher.find(Matcher.java:637)
	at java.util.regex.Matcher.replaceAll(Matcher.java:951)
	at java.lang.String.replaceAll(String.java.2210)
	.......
	at java.lang.Thread.run(Thread.java:745)

再怎么也不可能怀疑Java本身出了问题,两个关键词,replaceAll和正则,一看就是正则表达式出的问题。

有问题的正则表达式

把目光聚集在有问题的正则表达式上,代码中有这么一句

xml = xml.replaceAll("(?is).*?<file>(.*?)</file>.*", "$1");

这段代码意思是将字符串掐头去尾,取""之间的文本,再细分一下
(?is).*?<file>(.*?)</file>.*

  • (?is)不区分大小写并且多行匹配,是个flag,不用管
  • .*?匹配任意字符,并且是非贪婪匹配
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

代码狂魔v

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值