同上一个博客,test.html
代码详情:
@Test
public void testFile() throws Exception {
//解析文件
Document document = Jsoup.parse(new File("C:\\Users\\lenovo\\Desktop\\test.html"), "utf8");
String content = document.getElementsByTag("title").first().text();
System.out.println(content);
}
爬取数据的输出结果如下: