1.下载JSoup,https://jsoup.org/
2.得到如下图的jar文件
可以放到环境变量中的JAVA_Class路径中
这里尝试另一种方式,解压之后把org文件拿出来,放到所在java文件的目录中(因为必须知道包名,import又不能写成这样:import Jsoup所在文件夹/org.jsoup.jsoup)
该文件夹结构是这样的
3.测试如下
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class Spider{
public static void main(String[] args){
try{
Document doc = Jsoup.connect("http://www.baidu.com").get();
System.out.println(doc.outerHtml());
}catch(MalformedURLException ex){
System.err.println(ex);
}
}
}
4.仅给不希望使用IDE的朋友提供一个参考(这样做太折腾了)