快速入门
1、步骤
(1)导入Jsopu的jar包,与src文件夹平行
(2)获取Document对象(DOM树)
(3)获取对应的标签Element对象
(4)通过获取的对象来取出里面的数据
二、举例
1、先按照下图加载Jsoup驱动
2、为了方便我们将如下的xml文档放到与src文件夹下
Student.xml
<?xml version="1.0" encoding="UTF-8" ?>
<students>
<student>
<name> 张三</name>
<age>21</age>
<sex>male</sex>
</student>
<student>
<name> 李四</name>
<age>20</age>
<sex>male</sex>
</student>
<student>
<name> 王五</name>
<age>22</age>
<sex>male</sex>
</student>
</students>
JsoupDemo01.java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.File;
import java.io.IOException;
public class JsoupDemo01 {
public static void main(String[] args) throws IOException {
//2.获取Document对象,根据xml文档获取
//2.1获取student.xml的path
String path = JsoupDemo01.class.getClassLoader().getResource("Student.xml").getPath();
//2.2用前面的path创建一个File对象,该对象执行xml文档,加载文档进内存,解析xml文档,获取dom树,也就是Document对象
Document doc = Jsoup.parse(new File(path),"UTF-8");
//3.获取元素对象集
//下面返回的Elements是继承extend ArrayList<Element>
Elements nameArrayList = doc.getElementsByTag("name");
System.out.println("获取的集合name元素个数:"+nameArrayList.size());
//从集合中取出某个元素对象,然后获取其内容
Element element = nameArrayList.get(0);
String name = element.text();
System.out.println(name);
}
}
输出:
获取的集合name元素个数:3
张三