使用URL加载Document
问题
需要从网络中获取并解析HTML文档,并在其中查找数据(屏幕抓取)。
解决方案
使用Jsoup.connect(String url)
方法:
Document doc = Jsoup.connect("http://example.com/").get();
String title = doc.title();
描述
connect(String url)
方法创建一个新的Connection
,通过get()
方法获取并解析HTML文件。如果在连接URL时发生错误,将抛出一个IOException
,需要对其进行适当处理。
Connection
接口提供了方法链来处理特殊请求。
Document doc = Jsoup.connect("http://example.com")
.data("query", "java")
.userAgent("Mozilla")
.cookie("auth", "token")
.tiemout(3000)
.post();
此方法仅支持web URLs(http
和https
协议);如果需要从文件中加载,应使用parse(File in, String charserName)
方法来代替。