JAVA爬虫demo(东方财富）

孤独叶

于 2024-04-08 16:50:40 发布

阅读量242

点赞数 3

分类专栏：爬虫文章标签： java 爬虫开发语言

本文链接：https://blog.csdn.net/qq_45044477/article/details/137515319

版权

爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

这里是一个简单的 Java 爬虫程序，用来爬取东方财富网上的新闻消息。需要注意的是，爬取网站信息时需要遵守网站的规定，不要违反法律法规或侵犯他人权益。

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;

public class NewsCrawler {
    public static void main(String[] args) {
        String url = "http://www.eastmoney.com/";
        try {
            // 使用 Jsoup 进行网页解析
            Document doc = Jsoup.connect(url).get();
            // 获取新闻列表的元素
            Elements newsList = doc.select(".news-list li");
            for (Element news : newsList) {
                // 获取新闻标题和链接
                String title = news.select("a").text();
                String link = news.select("a").attr("href");
                System.out.println("标题：" + title);
                System.out.println("链接：" + link);
                System.out.println();
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

这个程序使用了 Jsoup 库来解析网页内容。它首先连接到东方财富网站，然后通过选择器 .news-list li 来获取新闻列表中的每一条新闻，然后提取新闻的标题和链接进行展示。

请注意，这只是一个简单的示例程序，实际应用中可能需要更复杂的逻辑来处理不同类型的新闻或者获取更详细的信息。同时，爬取网站信息时要注意网站的 robots.txt 规则和使用频率，避免对网站造成过大的负担。

孤独叶

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
JAVA爬虫demo(东方财富）

请注意，这只是一个简单的示例程序，实际应用中可能需要更复杂的逻辑来处理不同类型的新闻或者获取更详细的信息。同时，爬取网站信息时要注意网站的 robots.txt 规则和使用频率，避免对网站造成过大的负担。它首先连接到东方财富网站，然后通过选择器 .news-list li 来获取新闻列表中的每一条新闻，然后提取新闻的标题和链接进行展示。这里是一个简单的 Java 爬虫程序，用来爬取东方财富网上的新闻消息。需要注意的是，爬取网站信息时需要遵守网站的规定，不要违反法律法规或侵犯他人权益。
复制链接

扫一扫

专栏目录