jsoup库简单查询笔记
jsoup用来解析html文档
一、输入
1.1 从字符串中分析文档
使用静态方法,或者如果页面来自 Web,并且您希望获取绝对 URL。
parse(String html, String baseUri)
该方法能将输入的HTML解析为一个新的文档。参数baseUrl用来将相对URL转化为绝对URL,并指定从那个网站获取文档。
1.2 解析一个body片段
使用方法:
Jsoup.parseBodyFragment(String html)
1.3 从URL加载一个Document
Document doc = Jsoup.connect("http://www.csdn.com/").get();
String title = doc.title();
connect(String url) 方法创建一个新的 Connection, 和 get() 取得和解析一个HTML文件.
1.4 从一个文件加载一个文档
File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");
parse(File in, String charsetName, String baseUri)
这个方法用来加载和解析一个HT