读取xml文件

今天项目中,用到了遍历读取项目一个目录下的.xml文件,这里用的是dom4j,其中jaxen-1.1-beta-6.jar是dom4j中的xpath技术,dom4j默认支持里边的方法,该包作用是根据规则快速获取要找的节点,这里没用到。

package com.wms.core.utils.baseline;

import java.io.File;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;


public class dom4jReeadXml {
	/**
     * 拿到配置文件所在目录,遍历出其中所有的配置文件,存入到一个String[]数组中
     * @return listFilePath
     */
    public static String[] initmethod(String confPath){
    	//配置文件所在目录名
    	String taskconfPath = confPath;
    	//拿到目录所在路径
    	String listfilepath = dom4jReeadXml.class.getClassLoader().getResource(taskconfPath).getPath();
    	//System.out.println(listfilepath);
    	//遍历该目录下所有的配置文件,存入到String[]数组中
    	File listfile = new File(listfilepath);
    	String[] listFilePath = listfile.list();
    	//如果listFilePath下边还有目录则循环遍历知道发现.properties配置文件
    	/*for(String l : listFilePath){
    		File innerfile = new File(l);
    		if(innerfile.isDirectory()){
    			initmethod(l);
    		}
    	}*/
		return listFilePath;
    }
	
	
	public void readXml(String configfolder){
		String[] listFilePath = initmethod(configfolder);
        //System.out.println(listFilePath[0]);
		try {
			//1.创建一个xml解析器对象
			SAXReader reader = new SAXReader();
			for(int j=0;j<listFilePath.length;j++){
				//2.读取xml文档,返回Document对象
				Document doc = reader.read(new File(dom4jReeadXml.class.getClassLoader().getResource(configfolder+"/"+listFilePath[j]).getPath()));
				Element root=doc.getRootElement();//获取根节点  
				
				Map<String, Object> map = new HashMap<String, Object>();
				List<Element> elements = root.elements();
				for(Element element : elements){
					if("scripts".equals(element.getName())){
						List<Element> scripts = element.elements();
						Map<String, String> scriptMap = new HashMap<String, String>();
						
						for(int i=0;i<scripts.size();i++){
							Element script = scripts.get(i);
							Element id = script.element("id");
							Element value = script.element("value");
							String idName = id.getName();
							String idText = id.getText();
							String valueName = value.getName();
							String valueText = value.getText();
							//System.out.println(idName+":"+idText+"^^^^^^^"+valueName+":"+valueText);
							scriptMap.put(idText, valueText);
						}
						map.put("scripts", scriptMap);
					}else{
						String name = element.getName();
						String text = element.getText();
						//System.out.println(name+":"+text);
						map.put(name, text);
					}
				}
				//System.out.println(map);
				
				Map<String, String> scriptMap = (Map<String, String>) map.get("scripts");
				for(String key :scriptMap.keySet()){
					String value = scriptMap.get(key);
					//这调用其它方法
					/*Linux_1Process lp = new Linux_1Process();
					lp.setFileName(listFilePath[j]);
					lp.process(key, value);*/
				}
				
				
			}	
		} catch (DocumentException e) {
			e.printStackTrace();
			throw new RuntimeException(e);
		}
	
	}
 
	
	public static void main(String[] args) {
		dom4jReeadXml read = new dom4jReeadXml();
		read.readXml("com/wms/core/utils/baseline/xmlPath");
	}
}

 XML入门

引入

HTML: 负责网页的结构

CSS: 负责网页的样式(美观)

Javascript: 负责在浏览器端与用户进行交互。

 

负责静态的网页制作的语言

HTML语言特点:

1)由标签组成。 <title> <p> <hr/> <br/>

2)语法结构松散的    <p></p>   <p>  <P>

大小写不区分

结束标签和开始标签不一定匹配

<html>

<head>

<title>this is title</title>

</head>

<body>

<p>html标签</p>

<P>html标签</P>

<abc>abc标签</abc>  自定义标签

</body>

</html>

 

这种自定义标签可以把他们叫做xml标签

 HTMLXML的区别

HTML                                      XML

名称:       HyperText Markup Languae(超文本标记语言)    ExtendMarkup Languge(可扩展标签语言)

标签:     标签是w3c组成指定,固定的,约100来个         标签由开发者自己制定的(要按照一定的语法定义)

作用:      负责网页的结构                               1)描述带关系的数据(作为软件的配置文件): 含与被包含的关系

properties文件: key-value

name=eric

password=123456

 

<user>

<name>eric</name>

<password>123456</password>

</user>

作为数据的载体(存储数据,小型的“数据库”)  数据的载体(小型的“数据库”)

XML语法

xml文件以xml后缀名结尾。

xml文件需要使用xml解析器去解析。浏览器内置了xml解析器。

标签

语法: <student></student>  开始标签  标签体内容  结束标签

1<student/>  <student></student> 空标签。没有标签体内容

2xml标签名称区分大小写。

3xml标签一定要正确配对。

4xml标签名中间不能使用空格

5xml标签名不能以数字开头

6)注意: 在一个xml文档中,有且仅有一个根标签

  属性

语法: <Student name="eric">student</Student>

注意:

1)属性值必须以引号包含,不能省略,也不能单双引号混用!!!

2)一个标签内可以有多个属性,但不能出现重复的属性名!!!


文档声明

语法: <?xml version="1.0" encoding="utf-8"?>

 

version: xml的版本号

encoding: 解析xml文件时查询的码表(解码过程时查询的码表)

 

注意:

1)如果在ecplise工具中开发xml文件,保存xml文件时自动按照文档声明的encoding来保存文件。

2)如果用记事本工具修改xml文件,注意保存xml文件按照文档声明的encoding的码表来保存。

 转义字符

xml中内置了一些特殊字符,这些特殊字符不能直接被浏览器原样输出。如果希望把这些特殊字符按照原样输出到浏览器,对这些特殊字符进行转义。转义之后的字符就叫转义字节。

   特殊字符  转义字符

 <         <

 >         >

 "         "

&         &

空格      &nsbp;

CDATA

作用: 可以让一些需要进行包含特殊字符的内容统一进行原样输出。

<![CDATA[

<itast>

</itast>

]]>

 

处理指令

作用: 告诉xml解析如果解析xml文档

案例: <?xml-stylesheet type="text/css" href="1.css"?> 告诉xml解析该xml文档引用了哪个css文件

 

需要提前xml内容可以使用xml-stylesheet指令指令

XML解析

引入

xml文件除了给开发者看,更多的情况使用程序读取xml文件的内容。这叫做xml解析

XML解析方式(原理不同)

DOM解析

SAX解析

XML解析工具

DOM解析原理:

1JAXP oracle-Sun公司官方)

2JDOM工具(非官方)

3Dom4J工具(非官方)

三大框架(默认读取xml的工具就是Dom4j

.......

 SAX解析原理:

1Sax解析工具(oracle-sun公司官方)

  什么是DOM解析

DOM解析原理:xml解析器一次性把整个xml文档加载进内存,然后在内存中构建一颗Document的对象树,通过Document对象,得到树上的节点对象,通过节点对象访问(操作)到xml文档的内容。

Dom4j工具

非官方,不在jdk中。

 使用步骤:

1)导入dom4j的核心包。dom4j-1.6.1.jar

2)编写Dom4j读取xml文件代码

public static void main(String[] args) {

try {

//1.创建一个xml解析器对象

SAXReader reader = new SAXReader();

//2.读取xml文档,返回Document对象

Document doc = reader.read(new File("./src/contact.xml"));

System.out.println(doc);

} catch (DocumentException e) {

e.printStackTrace();

throw new RuntimeException(e);

}

}

 

Domj4读取xml文件

节点:

Iterator  Element.nodeIterator();  //获取当前标签节点下的所有子节点

 标签:

  Element  Document.getRootElement();  //获取xml文档的根标签

 Element   ELement.element("标签名") //指定名称的第一个子标签

  Iterator<Element> Element.elementIterator("标签名");//指定名称的所有子标签

List<Element>  Element.elements(); //获取所有子标签

属性:

String   Element.attributeValue("属性名") //获取指定名称的属性值

 Attribute    Element.attribute("属性名")//获取指定名称的属性对象

Attribute.getName()  //获取属性名称

Attibute.getValue()  //获取属性值

List<Attribute>  Element.attributes();  //获取所有属性对象

Iterator<Attribute> Element.attibuteIterator(); //获取所有属性对象

 

文本:

Element.getText();  //获取当前标签的文本

Element.elementText("标签名") //获取当前标签的指定名称的子标签的文本内容

总结:

1XML的作用

 配置文件(最常见)

 作为数据库

2XML语法

3XML解析(DOM解析)

 3.1 DOM解析原理

 3.2 Dom4j工具(基于DOM解析)

读取:

节点

标签节点

属性节点

文本节点

Dom4j修改xml文档

写出内容到xml文档

XMLWriter writer = new XMLWriter(OutputStream, OutputForamt)

wirter.write(Document);

 修改xml文档的API

增加:

DocumentHelper.createDocument()  增加文档

addElement("名称")  增加标签

addAttribute("名称",“值”)  增加属性

修改:

Attribute.setValue("")  修改属性值

Element.addAtribute("同名的属性名","")  修改同名的属性值

Element.setText("内容")  修改文本内容

删除

Element.detach();  删除标签  

Attribute.detach();  删除属性

xPath技术  

引入

问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!!

xPath作用

主要是用于快速获取所需的节点对象。

 dom4j中如何使用xPath技术

1)导入xPath支持jar包 。  jaxen-1.1-beta-6.jar

2)使用xpath方法

List<Node>  selectNodes("xpath表达式");   查询多个节点对象

Node       selectSingleNode("xpath表达式");  查询一个节点对象

xPath语法

/      绝对路径      表示从xml的根位置开始或子元素(一个层次结构)

//     相对路径       表示不分任何层次结构的选择元素。

*      通配符         表示匹配所有元素

[]      条件           表示选择什么条件下的元素

@     属性            表示选择属性节点

and     关系          表示条件的与关系(等价于&&

text()    文本           表示选择文本内容


SAX解析工具

SAX解析工具-  Sun公司提供的。内置在jdk中。org.xml.sax.*

 

核心的API

   SAXParser类: 用于读取和解析xml文件对象

parseFile f,DefaultHandler dh)方法:解析xml文件

参数一: File:表示 读取的xml文件。

    参数二: DefaultHandlerSAX事件处理程序。使用DefaultHandler的子类

例如:{

     1.创建SAXParser对象  

              SAXParser parser=SAXParserFactory.newInstance().newSAXParser();

                  2.调用parse方法

parser.parse(new File("./src/contact.xml"),new MyDefaultHandler());

[一个类继承class类名(extends DefaultHandler  在调用是创建传进去

 

DefaultHandler类的API:

void startDocument()  :  在读到文档开始时调用

void endDocument()  :在读到文档结束时调用

void startElement(String uri, String localName, String qName, Attributes attributes) :读到开始标签时调用

void endElement(String uri, String localName, String qName)   :读到结束标签时调用

void characters(char[] ch, int start, int length)  读到文本内容时调用

 

============DOM解析    vs   SAX解析 ========

DOM解析

SAX解析

原理: 一次性加载xml文档,不适合大容量的文件读取

原理: 加载一点,读取一点,处理一点。适合大容量文件的读取

DOM解析可以任意进行增删改成

SAX解析只能读取

DOM解析任意读取任何位置的数据,甚至往回读

SAX解析只能从上往下,按顺序读取,不能往回读

DOM解析面向对象的编程方法(NodeElementAttribute,Java开发者编码比较简单。

SAX解析基于事件的编程方法。java开发编码相对复杂。

 总结:

1Dom4j修改xml文档

 new XMLWrier();

......

2xPath技术: 快速查询xml节点

selectNodes()

selectSinglNode();

xpath表达式语言

3)  SAX解析

SAXParser parse

parser()

DefaultHandler类:

startElement();

characters();

endElement();

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值