用JAVA写一个超级简单的爬虫例子

最新推荐文章于 2024-08-13 03:11:52 发布

YSoup

最新推荐文章于 2024-08-13 03:11:52 发布

阅读量789

点赞数 1

分类专栏： Java 文章标签： java

本文链接：https://blog.csdn.net/Deep_rooted/article/details/103956930

版权

Java 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

用的是Jsoup，这个工具可以解析指定URL文档的内容。
如果是普通的工程则需要导入相应jar包，如果是Maven工程则需要引入坐标，坐标如下：

<!-- jsoup -->
        <dependency>
            <groupId>org.jsoup</groupId>
            <artifactId>jsoup</artifactId>
            <version>1.7.2</version>
        </dependency>

当然，也可以选择其他版本。如果需要导入jar包的话，可以自己下载。
3. 这里爬取的是淮河水利委员会水文局网站上的实时水情数据。
4. 代码如下：

package pachong;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.net.URL;
import java.util.Arrays;

public class JsoupDemo1
{
    public static void main(String[] args) throws Exception
    {
        Document document = Jsoup.parse(new URL("http://www.hrc.gov.cn/swj/"), 5000);
        Elements elements = document.select("[class=shuiqing_table] tr");
        for (Element element : elements)
        {
            String text = element.text();
            String[] s = text.split(" ");//字符串切割
            System.out.println(Arrays.toString(s));

        }

    }
}