Jsoup简单爬虫实战演练——解析字符串

一个简单页面的代码结构如下:(test.html路径:C:\Users\lenovo\Desktop\test.html)

代码详情:

   /**
     * 解析字符串
     */
    @Test
    public void testString() throws Exception {
        //使用工具类读取文件,获取字符串
        String content = FileUtils.readFileToString(new File("C:\\Users\\lenovo\\Desktop\\test.html"), "utf8");
        //解析字符串
        Document document = Jsoup.parse(content);
        String titleStr = document.getElementsByTag("title").first().text();
        System.out.println(titleStr);
    }

爬取数据的输出结果如下:

 

   解析URL和解析字符串的区别?

   主要的区别就是在解析字符串之前,先用工具类读取文件,获取字符串,之后的解析步骤跟URL并无区别。

发布了82 篇原创文章 · 获赞 47 · 访问量 11万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览