本文主要向大家介绍了介绍一下JAVA语言中的字符串替换函数replace与replaceAll的区别,通过具体的内容向大家展示,希望对大家学习JAVA语言有所帮助。
背景
业余时间又爬了下网站,这回碰到点问题,爬下来的数据有点奇葩。说是 xml 格式吧,又有些奇怪的东西,而且时不时来个\n,有效数据还被 包着在。这里我截取了部分贴出来:(为了方便查看,做了简单的格式化)
dwr.engine._remoteHandleCallback('0','0',"
<?xml version=\"1.0\" encoding=\"utf-8\"?>\n
\n\n
\n
2018-04-26 17:10:35\n
152473431173875997\n
null\n
pic\n
如何解析这个数据并不是难事,Jsoup轻松搞定,至于如何使用Jsoup,不是本文重点,这里不做介绍。
Jsoup解析数据时,只能解析到标签,比如上面的 title,通过Jsoup解析出来就是:
1
前面已经说过了,有效数据是 中间夹着的部分,如果就这么几个字串,那通过字符串截取方法也能轻松拿到有效数据。但是上面贴出来的只是局部,实际整个数据是一个list,里面有很多的,如果一个个去截取字串,无疑会很繁琐。
因此我的做法是:先将整个数据进行字符串替换,将 替换为空串"";然后交给Js