JavaEE:xml说明、约束、解析

一、XML文档

1.声明:

 <?xml version="1.0" encoding="UTF-8"  standalone="yes" ?>

2.注释:

<!--注释内容-->

3.CDATA区:

说明:CDATA区不会被解析。

语法:<![CDATA[内容]]>

转义字符:& 替代符 &   < 替代符 <  > 替代符 >   " 替代符 "   ' 替代符 '

4.处理指令:

<?xml-stylesheet type="text/css" href="1.css"?>

5.DTD约束(Document Type Definition,全称为文档类型定义):

(1)定义DTD约束:

<!DOCTYPE 书架 [
    <!ELEMENT 根节点 (子节点+)><!-- +表示子节点可以出现多次 -->
    <!ELEMENT 子节点 (孙节点1,孙节点2)><!-- 只允许出现这2个子节点 -->
    <!ELEMENT 孙节点1 (#PCDATA)>
    <!ELEMENT 孙节点2 (#PCDATA)>
]>

 (2)导入DTD文件约束xml:

<!DOCTYPE 根节点 SYSTEM "dtd文件">  <!-- 本地 -->
<!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL"> <!-- 公共 -->

6.使用Schema约束xml:

(1)定义xsd约束:

xmlns:XMLSchema名称空间/命名空间,固定
targetNamespace:自定义名称空间,如:http://www.yyh.com/yyh
elementFormDefault:元素的格式化情况

例:

<schema xmlns="http://www.w3.org/2001/XMLSchema"
    targetNamespace="http://www.yyh.com/yyh"
    elementFormDefault="qualified">
    <!-- 复杂节点 包含子节点,要用complexType和sequence包装 -->
    <element name="user"/>
          <complexType>
               <!-- maxOccurs表示子节点最多允许出现次数,默认为1次,无限次:unbounded -->
               <sequence maxOccurs="1">
                    <!-- 简单节点,不包含子节点,type为类别-->
    		    <element name="name" type="string"/>
                    <element name="age" type="int"/>
               </sequence>
          </complexType>
    </element>
</schema>

(2)导入xsd文件,约束xml:

xmlns:xsi:XMLSchema名称空间/命名空间,固定
xmlns:自定义名称空间,如:http://www.yyh.com/yyh
xsi:schemaLocation:自定义名称空间+空格+xsd约束文件相对路径,同个目录下写xsd文件名

例:

<?xml version="1.0" encoding="UTF-8"?>
<user xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns="http://www.yyh.com/yyh"
    xsi:schemaLocation="http://www.yyh.com/yyh yyh.xsd">
    <name>无名</name>
    <age>100</age>
</user>

7.编程校验XML文档正确性(dtd验证):

var xmldoc = new ActiveXObject("Microsoft.XMLDOM"); //创建xml文档解析器对象
xmldoc.validateOnParse = "true";   //开启xml校验
xmldoc.load("book.xml");  //装载xml文档
xmldoc.parseError.reason;   //获取错误信息
xmldoc.parseError.line;

 

二、jaxp技术操作XML文档:

jaxp开发包是J2SE的一部分,包为:
javax.xml、org.w3c.dom 、org.xml.sax包及其子包组成

1.读取XML文档:

(1)DOM方式解析XML文档:

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); //得到DOM 解析器的工厂
DocumentBuilder builder = factory.newDocumentBuilder();  //得到DOM 解析器对象
Document document = builder.parse("XML文档路径");  //解析XML文档,得到Document对象

(2)SAX方式解析XML文档:

SAXParserFactory spf = SAXParserFactory.newInstance();  //得到SAX解析器工厂
SAXParser sp = spf.newSAXParser(); //得到SAX解析器对象
XMLReader xmlReader = sp.getXMLReader();  //得到XML读取器
xmlReader.setContentHandler(new UserParserHandler());  //设置读取器的事件处理器,UserParserHandler为自定义类,在内部解析xml
xmlReader.parse("book.xml");  //解析XML文档,得到Document对象

2.写入XML文件(DOM方式):

TransformerFactory factory = TransformerFactory.newInstance(); //得到Transformer对象的工厂
Transformer trans = factory.newTransformer(); //利用工厂得到Transformer对象
trans.transform(new DOMSource(document), new StreamResult(new File("XML文档路径"))); //将Document对象数据源写入XML文件中

3.操作XML文档(DOM方式):

Element 节点 = document.createElement("节点名"); //建立节点
节点.setAttribute("属性名", "属性值");   //为节点增加属性与属性值
节点.getAttribute("属性名");  //得到节点该属性的值
Element 节点 = document.getElementById("id属性名");  //得到id属性所在节点
节点.setTextContent("文本内容");  //设置节点的文本内容
节点.getTextContent();  //得到节点的文本内容
节点.appendChild(子节点);  //为节点增加子节点
节点.getParentNode();  //得到节点的父节点
节点.removeChild(子节点);  //移除节点中该子节点
NodeList list = document.getElementsByTagName("节点名");  //得到所有此节点的NodeList集合
节点集合.item(0); //得到节点集合中第0个节点

 

三、dom4j技术操作XML文档:

共两个jar包:dom4j-x.x.x.jar,jaxen-x.x-beta-x.jar

1.读取XML文档:

SAXReader reader = new SAXReader();  //创建解析器
Document document = reader.read(new File("XML文档路径")); 解析XML文档,得到Document对象

2.写入XML文档:

OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("UTF-8");  //这解决中文乱码问题
XMLWriter write= new XMLWriter(new OutputStreamWriter(new FileOutputStream("XML文档路径"),format.getEncoding()),format);
write.write(document);
write.close();

3.操作XML文档:

Element 节点 = DocumentHelper.createElement("节点名");  //创建节点
节点.addAttribute("属性","属性值");   //为节点加属性与属性值
节点.add(子节点);  //为节点增加子节点
节点.addElement("子节点名");  //为节点增加子节点
节点.addCDATA("内容"); //为节点增加CDATA子节点
document.getRootElement();  //取得XML文件中根节点
List list = document.selectNodes("//节点名");  //得到这个名称的所有节点,返回List集合
List list = 节点.elements("子节点名");  //得到这个节点的所有该子节点,返回List集合
list.add(1, 节点);  //将该节点插入到节点列表的指定位置
Element element = (Element)document.selectSingleNode("//节点名[@属性名 = 属性值]"); //按属性值找出该节点
节点.attribute("属性名");  //得到节点中该属性的值
节点.attributeValue("子节点名")  //得到节点中该子节点的属性值
节点.getText();    //得到节点中的文本内容
节点.elementText("子节点名");  //得到节点中该子节点的文本内容
节点.getParent();  //得到节点的父节点
节点.remove(子节点);  //移除此节点下的该子节点
节点.asXML();  //将节点转化为字符串
Document document = DocumentHelper.parseText("字符串");  //将字符串转化为XML文档对象(Document对象)

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值