刀不用,久了就会生锈,regex久了没有使用,就会遗忘一点,下面总结一下regex的几个关键点:
1. .不是全部字符,它无法匹配\n ,所以使用时必须这样:
val dirtyString = "<td>fuck\n\nyour sis</td><td>hehe!!</td>" val handlePattern=new Regex("(<td>(?:.|\n)*?</td>)","td1") val result=handlePattern.replaceAllIn(dirtyString,(m:Match)=>{ m.group("td1").replace("\n","<br />")+"SUN" }) println(result) //<td>fuck<br /><br />your sis</td>SUN<td>hehe!!</td>SUN
规则的标签都得这么匹配,才能在标签内部有\n时不出错。
2.思考久了,我们就会犯困
我一直在思考怎么样在正则表达式中添加一个条件,让td标签中间不要出现</td>,而这根本就没有意义。尽管最后我想出了一个表达式,但最终 val handlePattern=new Regex("(<td>(?!<td>|</td>)*?</td>)","td1")也没有成功!
本文出自 “沐浴心情” 博客,请务必保留此出处http://lj3331.blog.51cto.com/5679179/1058410