问题
在用jsoup解析html的时候,如果想获得网页中的所有链接会首先获得标签是< a>的元素,然后使用attr(“href”)获得链接,这样获得的url可能不是绝对路径,有时候只能获得/…/*.html的url
解决方法
这时需要使用attr(“abs:href”)来获得绝对路径,所以在解析html是,指定baseURI很重要
在用jsoup解析html的时候,如果想获得网页中的所有链接会首先获得标签是< a>的元素,然后使用attr(“href”)获得链接,这样获得的url可能不是绝对路径,有时候只能获得/…/*.html的url
这时需要使用attr(“abs:href”)来获得绝对路径,所以在解析html是,指定baseURI很重要