java web-4.3xml解析

最新推荐文章于 2023-08-22 17:24:53 发布

zhendeWD

最新推荐文章于 2023-08-22 17:24:53 发布

阅读量98

点赞数

分类专栏： Javaweb 文章标签： xml 解析

本文链接：https://blog.csdn.net/weixin_39795049/article/details/104731072

版权

Javaweb 专栏收录该内容

58 篇文章 0 订阅

订阅专栏

解析：操作xml文档，将文档中的数据读取到内存中
操作xml文档：
1.解析（读取）：将文档中的数据读取到内存中
2.写入：将内存中的数据保存到xml文档中，持久化的存储

xml_解析_解析方式

方式：
1.DOM：将标记语言文档一次性加载进内存，在内存中形成一棵dom树
优点：操作方便，可以对文档进行CRUD的所有操作
缺点：占内存
2.SAX：逐行读取，基于事件驱动的。
优点：不占内存
缺点：只能读取，不能增删改

xml_解析_常见的解析器

1.JAXP:sun公司提供的解析器，支持dom和sax两种思想
2.DOM4J：一款非常优秀的解析器
3.Jsoup：jsoup是一款java的html解析器，可直接解析某个URL地址、html文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。
4.PULL：Android操作系统内置的解析器，sax方式的。

xml_解析_Jsoup_快速入门

使用步骤：
1.导入jar包
2.获取Document对象
3.获取对应的标签Element对象
4.获取数据
示例：
在这里插入图片描述

xml_解析_Jsoup_Jsoup对象

对象的使用：
1.Jsoup：工具类，可以解析html或xml文档，返回Document
parse：解析html或xml文档，返回Document
①parse（File in，String charsetName）：解析xml或html文件的
②parse（String html）：解析xml或html字符串
③parse（URL url,int timeoutMillis）：通过网络路径获取指定的html或xml的文档对象
示例：

 public static void main(String[] args) throws IOException {

        String path = demo2.class.getClassLoader().getResource("student.xml").getPath();
        Document document = Jsoup.parse(new File(path), "utf-8");

        System.out.println(document);

        String str ="<!--?xml version='1.0' encoding=\"UTF-8\"?--><!DOCTYPE students SYSTEM \"student.dtd\">\n" +
                "<html>\n" +
                " <head></head>\n" +
                " <body>\n" +
                "  <students> \n" +
                "   <student number=\"a001\"> \n" +
                "    <name>\n" +
                "     zhangsan\n" +
                "    </name> \n" +
                "    <age>\n" +
                "     18\n" +
                "    </age> \n" +
                "    <sex>\n" +
                "     male\n" +
                "    </sex> \n" +
                "   </student> \n" +
                "   <student number=\"a002\"> \n" +
                "    <name>\n" +
                "     lisi\n" +
                "    </name> \n" +
                "    <age>\n" +
                "     20\n" +
                "    </age> \n" +
                "    <sex>\n" +
                "     female\n" +
                "    </sex> \n" +
                "   </student> \n" +
                "  </students>\n" +
                " </body>\n" +
                "</html>\n" +
                "\n" +
                "Process finished with exit code 0\n";

        Document document1 = Jsoup.parse(str);
        System.out.println(document1);

        URL url = new URL("https://www.baidu.com");

        Document document2 = Jsoup.parse(url, 1000000000);
        System.out.println(document2);

    }

2.Document：文档对象，代表内存中的dom树

（1）.获取Element对象
①getElementsByTag（String tagName）：根据标签名称获取元素对象集合
②getElementsByAttribute（String key）：根据属性名称获取元素对象集合
③getElementsByAttributeValue（String key，String value）：根据对应的属性名和属性值获取元素对象
④getElementById（String id）：根据id属性值获取唯一的element对象
示例：

    public static void main(String[] args) throws IOException {

        String path = demo3.class.getClassLoader().getResource("student.xml").getPath();
        Document document = Jsoup.parse(new File(path), "utf-8");

        //获取所有student对象
        Elements elements = document.getElementsByTag("student");
        System.out.println(elements);

        System.out.println("===========");

        //获取number属性为a001的对象
        Elements elements1 = document.getElementsByAttributeValue("number", "a001");
        System.out.println(elements1);

        System.out.println("===========");
        
    }
}

3.Elements：元素Element对象的集合，可以当做ArrayList<Element>来使用

4.Element：元素对象

（1）获取子元素对象
①getElementsByTag（String tagName）：根据标签名称获取元素对象集合
②getElementsByAttribute（String key）：根据属性名称获取元素对象集合
③getElementsByAttributeValue（String key，String value）：根据对应的属性名和属性值获取元素对象
④getElementById（String id）：根据id属性值获取唯一的element对象
（2）获取属性值
String attr（String key）：根据属性名称获取属性值
（3）获取文本内容
String text（）：获取文本内容
String html（）：获取标签体的所有内容（包括子标签的标签和文本内容）
在这里插入图片描述

5.Node：节点对象
是Document和Element的父类

快捷的查询方式：
1.selector：选择器
2.XPath：

xml_解析_Jsoup_根据选择器查询

使用方法：Elements select（String cssQuery）
语法：参考selector类中定义的语法
在这里插入图片描述

xml_解析_Jsoup_根据Xpath查询

XPath即为XML路径语言，他是一种用来确定XML（标准通用标记语言的）
使用JSoup的Xpath需要额外导入jar包。
在这里插入图片描述

查询w3cschool参考手册使用xpath语法完成查询

zhendeWD

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java web-4.3xml解析

xml_解析_解析方式2_7_3_09_xml_解析_常见的解析器2_7_3_10_xml_解析_Jsoup_快速入门2_7_3_11_xml_解析_Jsoup_Jsoup对象2_7_3_12_xml_解析_Jsoup_Document对象2_7_3_13_xml_解析_Jsoup_Element对象2_7_3_14_xml_解析_Jsoup_根据选择器查询2_7_3_15_xml_...
复制链接

扫一扫

专栏目录