XML: 可扩展的标记性语言
XML:标记不固定,由用户自己定义,以数据保存为主。
http://www.w3school.com.cn/xml/xml_intro.asp
<?xml version = "1.0" encoding = "GB2312"?>
<addresslist>
<linkman>
<name>thystar</name>
<id>001</id>
<company>xxxxxxx</company>
<email>thystar@sina.com</email>
<tel>11111111</tel>
<site>www.thystar.com</site>
</linkman>
</addresslist>
XML是以树状形式显示的,结点由用户自己定义
所有的XML都有前导区和数据去两部分组成:
前导区:规定XML页面的一些属性
- version: 使用的XML版本,现在是1.0
- encoding:使用文字的编码
- standalone:是否独立运行
数据区:必须有一个根元素,下面可以存放多个子元素,子元素必须完结。
实体引用
在 XML 中,有 5 个预定义的实体引用:
< | < | 小于 |
> | > | 大于 |
& | & | 和号 |
' | ' | 单引号 |
" | " | 引号 |
注释:在 XML 中,只有字符 "<" 和 "&" 确实是非法的。大于号是合法的,但是用实体引用来代替它是一个好习惯。
<?xml version = "1.0" encoding = "GB2312"?>
<addresslist>
<linkman>
<book><<JAVA WEB>></book>
</linkman>
</addresslist>
XML中的注释:
<![CDATA[注释内容]]>
XML 解析
XML 文件都是由节点保存内容,所以解析就是从指定的节点中读取内容。
解析中定义了DOM和SAX两种形式的操作代码。都属于W3C标准。
应用中以dom为主。
DOM 文档对象形。(dom树)以树状形式出现,在操作中也以树的形式转换。
文字本身也是节点。
dom解析有四个核心接口:
- Doucument : 代表整个XML文档,dom数的根节点。可以访问XML中所有元素的内容
- Node: 代表dom树的一个节点
- NodeList: 一个节点的集合
- NamedNodeMap: 一组节点和其唯一名称对应的一一对应的关系。用于属性节点表示
除了解析之外,dom还用于XML文件的输出。
sax 操作XML的简单接口 。与dom不同,sax采用的是顺序模式进行访问
sax解析器操作时会触发一系列事件
文档与元素开始与结束时都会调用相关的处理方法。
JDom
JDom是一个开源的java组件,描述XML文档和文档的内容,为使用XML文档提供了一个低消耗的方法。
使用JDom生成一个XML文件:
import java.io.*;
import org.jdom.*;
import org.jdom.output.*;
public class JDomDemo1{
public static void main(String arg[]){
Element addresslist = new Element("addresslist");
Element linkman = new Element("linkman");
Element name = new Element("name");
Element email = new Element("email");
Attribute id = new Attribute("Id", "0001");
Document doc = new Document(addresslist);
name.setText("Java Web");
email.setText("web@gmail.com");
name.setAttribute(id);
linkman.addContent(name);
linkman.addContent(email);
addresslist.addContent(linkman);
XMLOutputter out = new XMLOutputter();
out.setFormat(out.getFormat().setEncoding("GBK"));
try{
out.output(doc, new FileOutputStream("E:" + File.separator + "JavaCode" + File.separator + "address.xml"));
}catch(Exception e){
e.printStackTrace();
}
}
}
<?xml version="1.0" encoding="GBK" ?>
- <addresslist>
- <linkman>
<name Id="0001">Java Web</name>
<email>web@gmail.com</email>
</linkman>
</addresslist>
读取这个文件:
import java.io.*;
import java.util.*;
import org.jdom.*;
import org.jdom.input.*;
public class ReadXML{
public static void main(String[] args) throws Exception {
SAXBuilder builder = new SAXBuilder();
Document read_doc = builder.build("E:" + File.separator + "JavaCode" +
File.separator + "address.xml");
Element stu = read_doc.getRootElement();
List list = stu.getChildren("linkman");
for(int i = 0; i < list.size(); i++){
Element e = (Element)list.get(i);
String name = e.getChildText("name");
String id = e.getChild("name").getAttribute("Id").getValue();
String email = e.getChildText("email");
System.out.println("姓名:" + name + "编号" + id);
System.out.println("EMAIL:" + email);
}
}
}
《JAVA WAB 开发实战经典--基础篇》