php中xpath,在PHP中运行XPath查询

在PHP中运行XPath查询

Builder.com

30/3/2005

URL: http://www.zdnet.com.cn/developer/webdevelop/story/0,3800067013,39360703,00.htm

XPath是一种可以对XML文档中的某一部分进行单独处理的一种语言,对于XSLT转换而言它尤其重要。XPath也可作为单独的工具管理应用程序中的XML数据,比如网络应用程序。

微软通过selectSingleNode() 和selectNodes()方法来提供的XPath功能,从而实现对DOM()节点和文档的操作。然而,PHP是通过程序中的环境(context)来实现XPath功能的。我将举例来说明如何利用PHP代码从XML文档中抽取不同的数据片断,并随后解释这些PHP代码是如何工作的。

在这个例子中,我使用了以下的XML数据。(注意:这些代码是在PHP 4.3.4、Windows XP和IIS 5.1条件下开发并运行成功的。)

color="yellow">Marmaduke

Garfield

Snoopy

Heathcliff

Spike

Sylvester

这个XML文档包含了一些元素(element)和属性(attribute),还有一个名域空间(namespace)的声明,都是一些基本的XML。在示例的PHP代码中,我们会从这个XML文档中得到多种的查询结果。

$sxml = ‘<?xml version="1.0"?>

Marmaduke

Garfield

Snoopy

Heathcliff

Spike

Sylvester

‘;

$xml = domxml_open_mem($sxml);

$xpc = XPath_new_context($xml);

XPath_register_ns($xpc, "x", "http://www.someplace.com");

$nodes = XPath_eval($xpc, "//x:row/x:dog[@color=‘yellow‘]/text()");

foreach ($nodes->nodeset as $node) {

print $node->content . "\n";

}

$nodes = XPath_eval($xpc, "//x:row/x:dog");

foreach ($nodes->nodeset as $node) {

print $xml->dump_node($node) . "\n";

}

$nodes = XPath_eval($xpc, "//x:cat/child::text()|//x:dog[@color=‘white‘ or

@color=‘gray‘]/text()");

foreach ($nodes->nodeset as $node) {

print $node->content . "\n";

}

$xml->free();

?>

首先,创建一个局部变量来存储XML字符串,这一信息原本可以被传递并成为HTTP POST请求的一部分,然而,我要把它包含在代码中;下一步是要使用domxml_open_mem()来创建一个DOM文档,domxml_open_mem()可以从有效的XML字符串中在内存中创建一个DOM文档对象,它只有一个参数:XML字符串;另一种方法是将XML存储于一个单独的文件中,然后使用domxml_open_file()从文件中读取XML,它也只有一个参数:XML文件的文件名。

创建了DOM文档对象之后,就可以通过XPath_new_context()来创建这一对象的XPath环境了,它只需一个参数:当前的DOM文档对象。这一环境用于XPath表达式的运算,如果需要的话还可以用于注册名域空间。既然在XML中已经包括了一个名域空间,则使用XPath_register_ns()来注册名域空间,这样才能在XPath查询中使用前缀,XPath_register_ns()包括了三个参数:他们分别是XPath环境、前缀和名域空间。

现在可以运行XPath查询了,可以通过XPath_eval()来实现,它的第一参数是XPath的环境,第二参数是XPath表达式,XPath_eval()将返回一个DOM节点的数组,在我的代码中,我对节点集合进行单步调试,可以得到某些形式的输出。

在第一个XPath例子中,我抓取了所有‘color’属性等于‘yellow’,并且在x:row节点下的x:dog文本元素,在PHP中的XPath表达式和MSXML中的XPath有些细微的区别,我将‘/text()’部分包含在表达式中则只返回文本节点,而在MSXML中,你需要使用‘text’属性来访问文本节点,对返回的文本节点使用‘content’属性则可以取得文本节点的内容。

在第二个例子中,我抓取了在x:row节点下的x:dog元素,然而,这次我对DOM文档对象使用dump_node()方法来打印出具有适当节点的整个XML,dump_node()接受一个参数:需要转储内容的DOM节点。

在最后一个例子中,我抓取了所有‘color’属性等于’gray’的所有x:cat文本节点和x:dog文本节点,我再次对节点集合进行单步调试并打印出每个节点的内容,最后释放这个DOM文档对象。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值