概念
Extensible Markup Language 可扩展标记语言。
- 可扩展:标签都是自定义的。
功能
- 存储数据:配置文件、在网络中传输
XML与HTML的区别
1.XML的标签是自定义的,HTML标签是预定义。
2.XML的语法严格,HTML语法松散。
3.XML是存储数据的,HTML是展示数据的。
语法
把xml文件放进浏览器不报错,即正确。
- 基本语法
1.xml文档的后缀名 .xml
2.第一行为文档声明,有空行也不行!!!
3.xml文档中有且只有一个根标签。
4.属性值必须用引号引起来,单双都可以。
5.标签必须有结束或自闭合。
6.xml区分大小写 - 快速入门
<?xml version='1.0' encoding='gbk' standalone='yes'?>//文档声明
<users>//根标签,必须有,且只有一个
<user id='1'>
<name>zhangsan</name>
<age>23</age>
<gender>male</gender>
</user>
<user id='2'>
<name>lisi</name>
<age>23</age>
<gender>famale</gender>
</user>
</users>
- 组成部分
1.文档声明
①格式:<?xml 属性列表 ?> 问好和尖括号和xm不能有空格
②属性列表:
·version:版本号(必须的属性!!!,写1.0就行)
·encoding:编码方式(告知解析引擎当前文档使用的字符集,默认:ISO-8859-1)
·standalone:是否独立,独立时(yes)不依赖其他文件,大多数不设置
2.指令
<?xml version='1.0' encoding='gbk' standalone='yes'?>//文档声明
<?xml-stylesheet type="text/css" herf="a.css"?>
<users>//根标签,必须有,且只有一个
<user id='1'>
<name>zhangsan</name>
<age>23</age>
<gender>male</gender>
</user>
<user id='2'>
<name>lisi</name>
<age>23</age>
<gender>female</gender>
</user>
</users>
a.css
name{
color:red;
}
了解一下
3.标签:标签名称自定义
规则:
①数字或标点符号不能开头
②名称可包含字母、数字及其他的字符
③名称不能以字母xm(或者XML、Xml等等)开头
④名称不能包含空格
4.属性:id值唯一
5.文本:特殊字符用转义,与html相同。
·CDATA区:在该区域中的数据会被原样展示
·格式:<![CDATA [数据] ]>
约束
谁编写xml——用户(程序员),软件(半成品软件/框架)使用者
谁解析xml——软件
约束:规定xml文档的书写规则
1.作为框架的使用者(程序员):能够在xml中引入约束文档并且能够简单的读懂约束文件。
2.分类:
①DTD:简单的约束技术
·引入dtd文档到xml文档中:
内部:将约束规则定义在xml文档中
···
外部:将约束的规则定义在外部的dtd文件中
···本地:
···网络:
②Schema:复杂的约束技术
3.解析:操作xml文档,将文档中的数据读取到内存中
···操作xml文档
①解析(读取):将文档中的数据读取到内存中
②写入:将内存中的数据保存到xml文档中。持久化的存储。
···解析xml的方式
①DOM:将标记语言文档一次性加载进内存,在内存中形成一颗dom树
DOM优点:操作方便,可以对文档进行CRUD的所有操作。
DOM缺点:占内存,不适用内存较小设备。
②SAX:逐行读取,基于事件驱动的。
SAX优点:不占内存
SAX缺点:只能读取,不能增删改
···xml常见的解析器:
①JAXP:sun公司提供的解析器,支持dom和sax两种思想。(基本不用)
②DOM4J:一款非常优秀的解析器
③Jsoup:jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
④PULL:Android操作系统内置的解析器,sax方式的。
···Jsoup:jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
①快速入门:
- 步骤:导入jar包
获取Document对象
获取对应的标签Element对象
获取数据
//2.1获取student.xml的path
String path = JsoupDemo1.class.getClassLoader().getResource("student.xml").path;
//2.2解析xml文档,加载文档进内存,获取dom树--->Document
Document document = Jsoup.parse(new File(path),"utf-8");
//3.获取元素对象Element
Elements elements = document.getElementsByTag("name");
System.out.println(elements.size());
//3.1获取第一个name的Element对象
Element element = elements.get(0);
//3.2获取数据
String name = element.text();
System.out.println(name);
②对象的使用
·Jsoup:工具类,可以解析html或xml文档,返回Document。
·Document:文档对象。代表内存中的dom树。主要用来获取Element对象
·Elements:元素Element对象的集合。可以当作ArrayList来使用。
·Element:元素对象。
获取子元素对象
获取属性值
String attr(String key):根据属性名称获取属性值
获取文本内容
String text():获取所有子标签的纯文本内容
String html():获取标签体的所有内容(包括子标签的标签和文本内容)
·Node:节点对象。