用Java写个简单的爬虫
public static void main(String[] args) {
Document doc = null;
try {
doc = Jsoup.connect("https://www.jd.com").timeout(5000).get();
//获取网站连接超过5秒报错
} catch (IOException e) {
e.printStackTrace();
}
// 获取a标签并清楚a标签中的内容并提取href(同样可以提取其他内容如span文章标题h2)
List elements = doc.select("a").empty().eachAttr("href");
System.out.println(elements);
}