这篇博文记录php中解析xml的一种方法:使用expat解析xml,下面是待解析的xml文件的内容:
<?xml version="1.0" encoding="utf-8"?>
<person id="1">
<name>zhangsan</name>
<age>21</age>
<job>teacher</job>
<sex>male</sex>
<company>IBM</company>
</person>
然后是编写php代码,解析上面的xml文档,下面是index.php的源码:
<?php
//创建一个解析器
$parser = xml_parser_create();
//开始一个标签时被调用
function start($parser, $name, $attr){
switch($name){
case "PERSON":
echo "----------start person----------<br/>";
echo "id = " . $attr["ID"] . "<br/>";
break;
case "NAME":
echo "name = ";
break;
case "AGE":
echo "age = ";
break;
case "SEX":
echo "sex = ";
break;
case "JOB":
echo "job = ";
break;
case "COMPANY":
echo "company = ";
break;
}
}
//结束一个标签时被调用
function stop($parser, $name){
if($name == "PERSON"){
echo "----------stop person----------";
}
echo "<br/>";
}
//遇到标签中的内容时被调用
function char($parser, $data){
echo $data;
}
xml_set_element_handler($parser, "start", "stop");
xml_set_character_data_handler($parser, "char");
$file = fopen("data.txt", "r") or die("open file error");
while(!feof($file)){
$line = fgets($file);
xml_parse($parser, $line) or die(sprintf("parse xml error : %d on line %d", xml_error_string(xml_get_error_code($parser)), xml_get_current_line_number($parser)));
}
xml_parser_free($parser);
?>
上面的解析过程主要分为如下几个步骤:
1、创建解析器,使用Expat解析xml时,创建解析器使用xml_parser_create()函数
2、编写开始标签、结束标签、遇到标签中的字符这三种情况对应的处理函数,下面分别说明:
①开始标签的处理函数,对应到上面代码中的start()函数,该函数有三个参数,说明如下:
start_element_handler ( resource $parser , string $name , array $attribs )
parser
第一个参数 parser 为指向要调用处理器的 XML 解析器的指针。
name
第二个参数 name 为该处理器为之被调用的元素名。如果大小写折叠(case-folding)对该解析器有效,元素名将用大写字母表示。
attribs
第三个参数 attribs 为一个包含有对应元素的属性的数组(如果该元素有属性)。数组元素的下标为属性名,元素的值即为属性的值。属性名将以和元素名同样的标准进行大小写折叠(case-folded),其值不进行大小写折叠。 属性的原始顺序将会被参数保留,用 each() 函数遍历 attribs 时,该数组下表的顺序和属性的顺序相同。
②结束标签的处理函数,对应到上面代码中的stop()函数,该函数有两个参数,说明如下:
end_element_handler ( resource $parser , string $name )
parser
第一个参数 parser 为指向要调用处理器的 XML 解析器的指针。
name
第二个参数 name 为该处理器为之被调用的元素名。如果大小写折叠(case-folding)对该解析器有效,元素名将用大写字母表示。
③遇到标签中的字符的处理函数,对应到上面代码中的char()函数,该函数有两个参数,说明如下:
bool xml_set_character_data_handler ( resource $parser , callback $handler )
为 parser 变量指向的 XML 解析器指定字符数据处理函数。handler 为表示一个函数名称的字符串,该函数必须在为 parser 指定的解析器调用 xml_parse() 函数时已存在。
由 handler 参数命名的函数名必须接受两个参数:
handler ( resource $parser , string $data )
parser
第一个参数 parser 为指向要调用处理器的 XML 解析器的指针。
data
第二个参数 data 为包含有字符数据的字符串。
上面的代码在浏览器中执行结果如下图: