一、jsoup是什么
jsoup是java的HTML解析器;它可以根据你提供的URL地址,来解析HTML的文本内容。
二、用法
加入maven依赖
<dependency>
<!-- jsoup HTML parser library @ http://jsoup.org/ -->
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.10.2</version>
</dependency>
代码如下:
\\抑制所有的黄色警告
@SuppressWarnings("all")
public class JsoupTest {
\\读取 形成txt文档
@Test
public void writeTest() throws Exception{
\\输入你要爬取的URL
Document document= Jsoup.connect("https://news.163.com/19/0921/15/EPJVQ1S4000189FH.html")