Jsoup简单爬虫实战演练——解析URL

最新推荐文章于 2023-08-07 16:21:30 发布

zqq_2016

最新推荐文章于 2023-08-07 16:21:30 发布

阅读量341

点赞数

分类专栏：爬虫文章标签： jsoup

本文链接：https://blog.csdn.net/zqq_2016/article/details/104005151

版权

爬虫专栏收录该内容

3 篇文章 0 订阅

订阅专栏

虽然爬取的都是一些特别简单的数据。但是，为了避免出现什么经济纠纷，本人还是选择以爬取自己的博客为例来进行数据的爬取。

由于本人也是刚开始学习jsoup，如果有什么不应该出现的问题，欢迎各位批评指正。

本人的博客主页：https://blog.csdn.net/zqq_2016，按F12键检查代码。

如何爬取网页中的title标签内容、爬取meta标签中，content属性的内容

代码详情：

   /**
     * 解析URL
     *
     */
@Test
    public void testUrl() throws Exception {
        //解析url地址，第一个参数是访问的url，第二个参数是访问时候的超时时间
        Document document = Jsoup.parse(new URL("https://blog.csdn.net/zqq_2016"), 1000);
        //使用标签选择器，获取title标签中的内容
        String title = document.getElementsByTag("title").first().text();
        //select选择器
        String meta_content_k = document.select("meta[name=csdn-baidu-search]").get(0).attr("content");
        String meta_content_d = document.select("meta[name=description]").get(0).attr("content");
        //打印
        System.out.println("title标签内容："+title);
        System.out.println("csdn-baidu-search："+meta_content_k);
        System.out.println("description："+meta_content_d);

    }

爬取数据的结果输出：

zqq_2016

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
1
评论
Jsoup简单爬虫实战演练——解析URL

虽然爬取的都是一些特别简单的数据。但是，为了避免出现什么经济纠纷，本人还是选择以爬取自己的博客为例来进行数据的爬取。由于本人也是刚开始学习jsoup，如果有什么不应该出现的问题，欢迎各位批评指正。本人的博客主页：https://blog.csdn.net/zqq_2016，按F12键检查代码。如何爬取网页中的title标签内容、爬取meta标签中，...
复制链接

扫一扫