正则表达式去除HTML文件中字段特殊格式【JAVA实现】
引言
目前大多数人通常都是使用两种方式来对HTML文件进行处理的。一个是使用Jsoup,另一个就是使用正则表达式。
Jsoup是一个基于Java的HTML解析器,提供了省时省力的API,方便对文档进行各种处理。
不过正则表达式的处理方法就比较“蠢”了。这种方法就是简单地通过对文件内部字符串的处理,来达成修改的目的。
正则表达式
正则表达式(regular expression)是一种字符串的匹配模式,可以比较方便地检索字符串,找到与筛选规则相匹配的字段,并基于检索功能对字符串进行一系列的操作。
这方面需要学
原创
2021-08-09 20:10:03 ·
298 阅读 ·
0 评论