做爬虫的时候数据的清洗也是一大重点,往往绕不开三种处理办法
1.正则表达式
2.xpath表达式
3.json
java解析json格式,需要用到第三方包,所以需要用maven下载
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>fastjson</artifactId>
<version>1.2.62</version>
</dependency>
做爬虫的时候数据的清洗也是一大重点,往往绕不开三种处理办法
1.正则表达式
2.xpath表达式
3.json
java解析json格式,需要用到第三方包,所以需要用maven下载
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>fastjson</artifactId>
<version>1.2.62</version>
</dependency>