Jsoup实现java爬虫,爬取新浪微博新闻内容,并存储在磁盘
jsoup简介
jsoup是一款java的HTML解析器,主要用来对HTML解析,可以直接解析某个地址的url地址,获取HTML文本内容,他提供了一套非常省力的API,可以通过DOM,CSS以及类似于JQuery的方法来取
出操作数据,可以配合下面的图,来进行理解
要是想要爬取网页内容,首先需要导入依赖的jar包
<dependency>
<groupId>org...
原创
2019-12-11 21:46:50 ·
1019 阅读 ·
2 评论