这里是一个简单的 Java 爬虫程序,用来爬取东方财富网上的新闻消息。需要注意的是,爬取网站信息时需要遵守网站的规定,不要违反法律法规或侵犯他人权益。
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
public class NewsCrawler {
public static void main(String[] args) {
String url = "http://www.eastmoney.com/";
try {
// 使用 Jsoup 进行网页解析
Document doc = Jsoup.connect(url).get();
// 获取新闻列表的元素
Elements newsList = doc.select(".news-list li");
for (Element news : newsList) {
// 获取新闻标题和链接
String title = news.select("a").text();
String link = news.select("a").attr("href");
System.out.println("标题:" + title);
System.out.println("链接:" + link);
System.out.println();
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
这个程序使用了 Jsoup 库来解析网页内容。它首先连接到东方财富网站,然后通过选择器 .news-list li 来获取新闻列表中的每一条新闻,然后提取新闻的标题和链接进行展示。
请注意,这只是一个简单的示例程序,实际应用中可能需要更复杂的逻辑来处理不同类型的新闻或者获取更详细的信息。同时,爬取网站信息时要注意网站的 robots.txt 规则和使用频率,避免对网站造成过大的负担。