Jsoup :工具类,可以解析html或xml文档,返回Document
parse :解析html或xml文档,返回bocument
parse(File in, string charsetName) : 解析xml或html文件的。
parse(String html) :解析xml或html字符串
parse(URL url, int timeoutMillis) :通过网络路径获取指定的html或xml的文档对象
Document :文档对象。代表内存中的dom树
获取Element对象
getElementById(String id) :根据id属性值获取唯一的element对象
getElementsByTag(string tagName) :根据标签名称获取元素对象集合
getElementsByAttribute(String key) :根据属性名称获取元素对象集合
getElementsByAttributevalue(String key, string value) :根据对应的属性名和属性值获取元素对象集合
Elements :元素Element对象的集合。可以当做ArrayList来使用
EIement :元素对象
1.获取子元素对象
getElementById(String id) :根据i d属性值获取唯一的element对象
getElementsByTag(String tagName) :根据标签名称获取元素对象集合
getElementsByAttribute(string key) :根据属性名称获取元素对象集合
getElementsByAttributeValue(String key, string value) :根据对应的属性名和属性值获取元素对象集合
2.获取属性值
string attr(String key) :根据属性名称获取属性值
3.获取文本内容
String text():获取文本内容
String html():获取标签体的所有内容(包括字标签的字符串内容)
Node :节点对象
是Document和Element的父类