今天项目中,用到了遍历读取项目一个目录下的.xml文件,这里用的是dom4j,其中jaxen-1.1-beta-6.jar是dom4j中的xpath技术,dom4j默认支持里边的方法,该包作用是根据规则快速获取要找的节点,这里没用到。
package com.wms.core.utils.baseline;
import java.io.File;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class dom4jReeadXml {
/**
* 拿到配置文件所在目录,遍历出其中所有的配置文件,存入到一个String[]数组中
* @return listFilePath
*/
public static String[] initmethod(String confPath){
//配置文件所在目录名
String taskconfPath = confPath;
//拿到目录所在路径
String listfilepath = dom4jReeadXml.class.getClassLoader().getResource(taskconfPath).getPath();
//System.out.println(listfilepath);
//遍历该目录下所有的配置文件,存入到String[]数组中
File listfile = new File(listfilepath);
String[] listFilePath = listfile.list();
//如果listFilePath下边还有目录则循环遍历知道发现.properties配置文件
/*for(String l : listFilePath){
File innerfile = new File(l);
if(innerfile.isDirectory()){
initmethod(l);
}
}*/
return listFilePath;
}
public void readXml(String configfolder){
String[] listFilePath = initmethod(configfolder);
//System.out.println(listFilePath[0]);
try {
//1.创建一个xml解析器对象
SAXReader reader = new SAXReader();
for(int j=0;j<listFilePath.length;j++){
//2.读取xml文档,返回Document对象
Document doc = reader.read(new File(dom4jReeadXml.class.getClassLoader().getResource(configfolder+"/"+listFilePath[j]).getPath()));
Element root=doc.getRootElement();//获取根节点
Map<String, Object> map = new HashMap<String, Object>();
List<Element> elements = root.elements();
for(Element element : elements){
if("scripts".equals(element.getName())){
List<Element> scripts = element.elements();
Map<String, String> scriptMap = new HashMap<String, String>();
for(int i=0;i<scripts.size();i++){
Element script = scripts.get(i);
Element id = script.element("id");
Element value = script.element("value");
String idName = id.getName();
String idText = id.getText();
String valueName = value.getName();
String valueText = value.getText();
//System.out.println(idName+":"+idText+"^^^^^^^"+valueName+":"+valueText);
scriptMap.put(idText, valueText);
}
map.put("scripts", scriptMap);
}else{
String name = element.getName();
String text = element.getText();
//System.out.println(name+":"+text);
map.put(name, text);
}
}
//System.out.println(map);
Map<String, String> scriptMap = (Map<String, String>) map.get("scripts");
for(String key :scriptMap.keySet()){
String value = scriptMap.get(key);
//这调用其它方法
/*Linux_1Process lp = new Linux_1Process();
lp.setFileName(listFilePath[j]);
lp.process(key, value);*/
}
}
} catch (DocumentException e) {
e.printStackTrace();
throw new RuntimeException(e);
}
}
public static void main(String[] args) {
dom4jReeadXml read = new dom4jReeadXml();
read.readXml("com/wms/core/utils/baseline/xmlPath");
}
}
XML入门
引入
HTML: 负责网页的结构
CSS: 负责网页的样式(美观)
Javascript: 负责在浏览器端与用户进行交互。
负责静态的网页制作的语言
HTML语言特点:
1)由标签组成。 <title> <p> <hr/> <br/>
2)语法结构松散的 <p></p> <p> <P>
大小写不区分
结束标签和开始标签不一定匹配
<html> <head> <title>this is title</title> </head> <body> <p>html标签</p> <P>html标签</P> <abc>abc标签</abc> 自定义标签 </body> </html> |
这种自定义标签可以把他们叫做xml标签。
HTML和XML的区别
HTML XML
名称: HyperText Markup Languae(超文本标记语言) ExtendMarkup Languge(可扩展标签语言)
标签: 标签是w3c组成指定,固定的,约100来个 标签由开发者自己制定的(要按照一定的语法定义)
作用: 负责网页的结构 1)描述带关系的数据(作为软件的配置文件):包 含与被包含的关系
properties文件: key-value
name=eric
password=123456
<user>
<name>eric</name>
<password>123456</password>
</user>
作为数据的载体(存储数据,小型的“数据库”) 数据的载体(小型的“数据库”)XML语法
xml文件以xml后缀名结尾。
xml文件需要使用xml解析器去解析。浏览器内置了xml解析器。
标签
语法: <student></student> 开始标签 标签体内容 结束标签
1)<student/> 或 <student></student> 空标签。没有标签体内容
2)xml标签名称区分大小写。
3)xml标签一定要正确配对。
4)xml标签名中间不能使用空格
5)xml标签名不能以数字开头
6)注意: 在一个xml文档中,有且仅有一个根标签
属性
语法: <Student name="eric">student</Student>
注意:
1)属性值必须以引号包含,不能省略,也不能单双引号混用!!!
2)一个标签内可以有多个属性,但不能出现重复的属性名!!!
文档声明
语法: <?xml version="1.0" encoding="utf-8"?>
version: xml的版本号
encoding: 解析xml文件时查询的码表(解码过程时查询的码表)
注意:
1)如果在ecplise工具中开发xml文件,保存xml文件时自动按照文档声明的encoding来保存文件。
2)如果用记事本工具修改xml文件,注意保存xml文件按照文档声明的encoding的码表来保存。
转义字符
在xml中内置了一些特殊字符,这些特殊字符不能直接被浏览器原样输出。如果希望把这些特殊字符按照原样输出到浏览器,对这些特殊字符进行转义。转义之后的字符就叫转义字节。
特殊字符 转义字符
< <
> >
" "
& &
空格 &nsbp;
CDATA块
作用: 可以让一些需要进行包含特殊字符的内容统一进行原样输出。
<![CDATA[
<itast>
</itast>
]]>
处理指令
作用: 告诉xml解析如果解析xml文档
案例: <?xml-stylesheet type="text/css" href="1.css"?> 告诉xml解析该xml文档引用了哪个css文件
需要提前xml内容可以使用xml-stylesheet指令指令
XML解析
引入
xml文件除了给开发者看,更多的情况使用程序读取xml文件的内容。这叫做xml解析
XML解析方式(原理不同)
DOM解析
SAX解析
XML解析工具
DOM解析原理:
1)JAXP (oracle-Sun公司官方)
2)JDOM工具(非官方)
3)Dom4J工具(非官方)
三大框架(默认读取xml的工具就是Dom4j)
.......
SAX解析原理:
1)Sax解析工具(oracle-sun公司官方)
什么是DOM解析
DOM解析原理:xml解析器一次性把整个xml文档加载进内存,然后在内存中构建一颗Document的对象树,通过Document对象,得到树上的节点对象,通过节点对象访问(操作)到xml文档的内容。
Dom4j工具
非官方,不在jdk中。
使用步骤:
1)导入dom4j的核心包。dom4j-1.6.1.jar
2)编写Dom4j读取xml文件代码
public static void main(String[] args) { try { //1.创建一个xml解析器对象 SAXReader reader = new SAXReader(); //2.读取xml文档,返回Document对象 Document doc = reader.read(new File("./src/contact.xml")); System.out.println(doc); } catch (DocumentException e) { e.printStackTrace(); throw new RuntimeException(e); } } |
Domj4读取xml文件
节点:
Iterator Element.nodeIterator(); //获取当前标签节点下的所有子节点
标签:
Element Document.getRootElement(); //获取xml文档的根标签
Element ELement.element("标签名") //指定名称的第一个子标签
Iterator<Element> Element.elementIterator("标签名");//指定名称的所有子标签
List<Element> Element.elements(); //获取所有子标签
属性:
String Element.attributeValue("属性名") //获取指定名称的属性值
Attribute Element.attribute("属性名");//获取指定名称的属性对象
Attribute.getName() //获取属性名称
Attibute.getValue() //获取属性值
List<Attribute> Element.attributes(); //获取所有属性对象
Iterator<Attribute> Element.attibuteIterator(); //获取所有属性对象
文本:
Element.getText(); //获取当前标签的文本
Element.elementText("标签名") //获取当前标签的指定名称的子标签的文本内容
总结:
1)XML的作用
配置文件(最常见)
作为数据库
2)XML语法
3)XML解析(DOM解析)
3.1 DOM解析原理
3.2 Dom4j工具(基于DOM解析)
读取:
节点
标签节点
属性节点
文本节点
Dom4j修改xml文档
写出内容到xml文档
XMLWriter writer = new XMLWriter(OutputStream, OutputForamt)
wirter.write(Document);
修改xml文档的API
增加:
DocumentHelper.createDocument() 增加文档
addElement("名称") 增加标签
addAttribute("名称",“值”) 增加属性
修改:
Attribute.setValue("值") 修改属性值
Element.addAtribute("同名的属性名","值") 修改同名的属性值
Element.setText("内容") 修改文本内容
删除
Element.detach(); 删除标签
Attribute.detach(); 删除属性
xPath技术
引入
问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!!
xPath作用
主要是用于快速获取所需的节点对象。
在dom4j中如何使用xPath技术
1)导入xPath支持jar包 。 jaxen-1.1-beta-6.jar
2)使用xpath方法
List<Node> selectNodes("xpath表达式"); 查询多个节点对象
Node selectSingleNode("xpath表达式"); 查询一个节点对象
xPath语法
/ 绝对路径 表示从xml的根位置开始或子元素(一个层次结构)
// 相对路径 表示不分任何层次结构的选择元素。
* 通配符 表示匹配所有元素
[] 条件 表示选择什么条件下的元素
@ 属性 表示选择属性节点
and 关系 表示条件的与关系(等价于&&)
text() 文本 表示选择文本内容
SAX解析工具
SAX解析工具- Sun公司提供的。内置在jdk中。org.xml.sax.*
核心的API:
SAXParser类: 用于读取和解析xml文件对象
parse(File f,DefaultHandler dh)方法:解析xml文件
参数一: File:表示 读取的xml文件。
参数二: DefaultHandler:SAX事件处理程序。使用DefaultHandler的子类
例如:{
1.创建SAXParser对象
SAXParser parser=SAXParserFactory.newInstance().newSAXParser();
2.调用parse方法
parser.parse(new File("./src/contact.xml"),new MyDefaultHandler());
}[一个类继承class类名(extends DefaultHandler) 在调用是创建传进去
DefaultHandler类的API:
void startDocument() : 在读到文档开始时调用
void endDocument() :在读到文档结束时调用
void startElement(String uri, String localName, String qName, Attributes attributes) :读到开始标签时调用
void endElement(String uri, String localName, String qName) :读到结束标签时调用
void characters(char[] ch, int start, int length) :读到文本内容时调用
============DOM解析 vs SAX解析 ========
DOM解析 | SAX解析 |
原理: 一次性加载xml文档,不适合大容量的文件读取 | 原理: 加载一点,读取一点,处理一点。适合大容量文件的读取 |
DOM解析可以任意进行增删改成 | SAX解析只能读取 |
DOM解析任意读取任何位置的数据,甚至往回读 | SAX解析只能从上往下,按顺序读取,不能往回读 |
DOM解析面向对象的编程方法(Node,Element,Attribute),Java开发者编码比较简单。 | SAX解析基于事件的编程方法。java开发编码相对复杂。 |
总结:
1)Dom4j修改xml文档
new XMLWrier();
......
2)xPath技术: 快速查询xml节点
selectNodes()
selectSinglNode();
xpath表达式语言
3) SAX解析
SAXParser parse
parser()
DefaultHandler类:
startElement();
characters();
endElement();