------- android培训、java培训、期待与您交流! ----------
Jsoup
一、解析Html文档
Jsoup处理HTML文档是将用户输入的HTML文档转换成一个Document对象
1、解析Html字符串
Document doc =parse(String html)
2、根据url地址加载Document对象
Document doc =connect(String url).get()
connect(String url) 返回Connection接口,包含Connection.Request,Connection.Response,Connection.Method等内部接口,分别代表HTTP请求,响应和GET、POST方法
Connection成员方法:
request():获取Connection.Request对象
request(Connection.Requestrequest):设置request对象
response():获取Connection.Response对象
response(Connection.Responseresponse):设置response对象
设置请求:
data():设置请求数据,GETs方法在query string:?name=jsoup&language=Java,POST方法请求数据在request body
Firebug截图:
其中wd=java就是请求数据
cookie():设置request的cookie
userAgent(StringuserAgent):设置User-Agent
timeout():设置连接超时时间
get():使用Get方法访问URL
post():使用Post方法访问URL
followRedirects():设置是否跟踪URL重定位
3、根据文件加载Document对象
Document doc =parser(File in, String charset,String baseURL)
baseURL:因为 HTML 文档中会有很多如链接、图片以及所引用的外部脚本、css 文件等,baseURL 参数的意思就是当