快速从一个XML文件中查找信息

原创 2004年08月27日 17:09:00

在网络时代,XML文件起到了一个保存和传输数据的作用。Soap协议通过Xml交流信息,数据库通过Xml文件存取等等。那么怎样快速的从一个XML文件中取得所需的信息呢?

我们知道,JAVA的JAXP中和Microsoft.Net都有Xml分析器,Microsoft.Net是边读边分析,而JAXP是读到内存中然后才进行分析(还有一种是事件机制去读),总而言之,是不利于快速读取。基于此,Microsoft.Net 和JAXP都提供了XPATH机制,来快速定位到XML文件中所需的节点。

例如有一个XML文件:booksort.xml:

<?xml version="1.0"?>

<!-- a fragment of a book store inventory database -->

<bookstore xmlns:bk="urn:samples">

<book genre="novel" publicationdate="1997" bk:ISBN="1-861001-57-8">

<title>Pride And Prejudice</title>

<author>

<first-name>Jane</first-name>

<last-name>Austen</last-name>

</author>

<price>24.95</price>

</book>

<book genre="novel" publicationdate="1992" bk:ISBN="1-861002-30-1">

<title>The Handmaid's Tale</title>

<author>

<first-name>Margaret</first-name>

<last-name>Atwood</last-name>

</author>

<price>29.95</price>

</book>

<book genre="novel" publicationdate="1991" bk:ISBN="1-861001-57-6">

<title>Emma</title>

<author>

<first-name>Jane</first-name>

<last-name>Austen</last-name>

</author>

<price>19.95</price>

</book>

<book genre="novel" publicationdate="1982" bk:ISBN="1-861001-45-3">

<title>Sense and Sensibility</title>

<author>

<first-name>Jane</first-name>

<last-name>Austen</last-name>

</author>

<price>19.95</price>

</book>

</bookstore>

如果我们想快速查找”last-name”等于”Austen”的所有标题名,可以通过以下方法可以得到:

XmlReaderSample.cs

//Corelib.net/System.Xml.Xsl/XPathDocument Class

//Author :Any


using System;

using System.IO;

using System.Xml;

using System.Xml.XPath;


public class XmlReaderSample

{

public static void Main()

{

XmlTextReader myxtreader = new XmlTextReader("booksort.xml");

XmlReader myxreader = myxtreader;

XPathDocument doc = new XPathDocument(myxreader);

XPathNavigator nav = doc.CreateNavigator();


XPathExpression expr;

expr = nav.Compile("descendant::book[author/last-name='Austen']");


//expr.AddSort("title", XmlSortOrder.Ascending, XmlCaseOrder.None, "", XmlDataType.Text);


XPathNodeIterator iterator = nav.Select(expr);

while (iterator.MoveNext())

{

XPathNavigator nav2 = iterator.Current;

nav2.MoveToFirstChild();

Console.WriteLine("Book title: {0}", nav2.Value);

}

}

}

运行这个程序,结果为:

Book title: Pride And Prejudice

Book title: Emma

Book title: Sense and Sensibility


可以看到查找正确。

利用XPATH中的一些功能,也可以实现简单的排序和简单运算。如在数据库中经常要对数据进行汇总,就可用XPATH实现。

如:

order.xml

<!--Represents a customer order-->

<order>

<book ISBN='10-861003-324'>

<title>The Handmaid's Tale</title>

<price>19.95</price>

</book>

<cd ISBN='2-3631-4'>

<title>Americana</title>

<price>16.95</price>

</cd>

</order>


和:books.xml

<?xml version="1.0"?>

<!-- This file represents a fragment of a book store inventory database -->

<bookstore>

<book cc="dd" xmlns:bk="urn:sample" xmlns:ns="http://www.Any.com" genre="autobiography" publicationdate="1981" ISBN="1-861003-11-0">

<title>The Autobiography of Benjamin Franklin</title>

<ns:author>

<first-name>Benjamin</first-name>

<last-name>Franklin</last-name>

</ns:author>

<price>8.99</price>

</book>

<book genre="novel" publicationdate="1967" ISBN="0-201-63361-2">

<title>The Confidence Man</title>

<author>

<first-name>Herman</first-name>

<last-name>Melville</last-name>

</author>

<price>11.99</price>

</book>

<book genre="philosophy" publicationdate="1991" ISBN="1-861001-57-6">

<title>The Gorgias</title>

<author>

<name>Plato</name>

</author>

<price>9.99</price>

</book>

</bookstore>


我们可以对该XML文件中的price求和,以得到价格总数。

Evaluate.cs

//Corelib.net/System.Xml.Xsl/XPathNavigator Class

//Author :Any


using System;

using System.IO;

using System.Xml;

using System.Xml.XPath;

 

public class EvaluateSample

{

public static void Main()

{

EvaluateSample myEvaluateSample = new EvaluateSample();

myEvaluateSample.test("books.xml");

}


public void test(String args)

{

try

{

//test Evaluate(String);

XPathDocument myXPathDocument = new XPathDocument(args);

XPathNavigator myXPathNavigator = myXPathDocument.CreateNavigator();

Console.WriteLine(myXPathNavigator.Evaluate("sum(descendant::book/price)"));


//testEvaluate(XPathExpression);

XmlDocument doc = new XmlDocument();

doc.Load("order.xml");

XPathNavigator nav = doc.CreateNavigator();

XPathExpression expr = nav.Compile("sum(//price/text())");

Console.WriteLine(nav.Evaluate(expr));


//testEvaluate(XPathExpression);


XPathNodeIterator myXPathNodeIterator = nav.Select("descendant::book/title");

expr = nav.Compile("sum(//price/text())");

Console.WriteLine(nav.Evaluate(expr,myXPathNodeIterator));


}

catch (Exception e)

{

Console.WriteLine ("Exception: {0}", e.ToString());

}

}


}

运行这个程序,结果如下:

30.97

36.9

36.9

我们可以看到,30.97是books.xml中所有price值的总和,而36.9则是order.xml中所有price值的总和。通过XPAH不仅可以快速查找信息,而且还可以对信息进行一些基本的处理。

第二章 XML信息检索基础

2.1 信息检索系统数据检索系统可分为四个部分: 1、数据预处理: 从多种格式的数据中提取正文和其他所需的信息。 2、索引生成: 索引是索引项的...
  • u012889441
  • u012889441
  • 2017-02-19 19:51:33
  • 227

【JavaScript】JS读取XML文件并进行搜索

需求效果 点击链接,当前页面加载xml文件并展示对应内容 通过搜索框,搜索xml文件内节点数据,展示包含内容的节点数据 功能实现Demo最终实现效果 http://loadxmldemo.coderf...
  • diandianxiyu
  • diandianxiyu
  • 2016-02-17 23:47:49
  • 1600

在win7中搜索xml文件中的内容

选择【组织】-->【搜索】-->【始终搜索文件名和内容】--> 【确定】 即可
  • aa_moon
  • aa_moon
  • 2016-12-02 15:55:12
  • 790

XML(4)XDocument和XmlDocument搜索指定的节点

XmlDocument StringBuilder str = new StringBuilder(); XmlDocume...
  • IstarI
  • IstarI
  • 2016-06-01 21:28:09
  • 2345

在eclipse中如何在大量项目中查找指定文件

在eclipse中如果希望在大量的项目中寻找指定的文件可不是一件轻松的事,还好eclipse提供了强大的搜索功能。 我们可以通过通配符或正则表达式来设定查寻条件,下面是操作示例:     ...
  • inowcome
  • inowcome
  • 2011-08-19 11:57:32
  • 86808

查询XML内容中节点的几个常用方法

       对Xml的节点进行简单查询的时候,常用的可以使用如下方法:(1) XmlNode node = doc.SelectSingleNode("//AllNode/Node[@ID = ’a...
  • guilin_gavin
  • guilin_gavin
  • 2008-06-02 16:33:00
  • 1227

XML 查找节点方法。

1. using System.XMLXmlNodeList nodelist = xmlDocument.DocumentElement.GetElementsByTagName("SharesSt...
  • fxhflower
  • fxhflower
  • 2010-06-22 10:39:00
  • 3377

【XML】XML的基本使用(增删改查)

文章参考:http://www.xuanyusong.com/archives/1901 C# using UnityEngine; using System.Collections; us...
  • ldy597321444
  • ldy597321444
  • 2016-11-17 19:21:40
  • 2655

对XML进行简单的查询,插入,删除,编辑操作

  以前一直搞不明白为什么要用XML这个东西,总觉的没什么用,可是后来慢慢才知道如今的WEB应用已经无法离开XML了,尽管我此刻对XML的认识依然是一知半解,但总算是知道了一些最基本的操作,今天只是讲...
  • cmoonc
  • cmoonc
  • 2007-01-08 19:59:00
  • 1791

XML 数据的查询

 2 XML 数据的查询   最常见的XML数据类型有:Element, Attribute,Comment, Text.   Element, 指形如Tom的节点。它可以包括:Element, Te...
  • fallingstarNo1
  • fallingstarNo1
  • 2006-12-27 14:09:00
  • 827
收藏助手
不良信息举报
您举报文章:快速从一个XML文件中查找信息
举报原因:
原因补充:

(最多只允许输入30个字)