筑巢时间(Nesting Time)
前面的例子只是用来说明问题的。如果你真想把RDF内容插入到Web站点当中,就需要把事情做的更好一些。所以把前面的脚本的作了改进,新增了一些东西,从而简化格式化RDF数据的任务。
<html><head><basefont face="Verdana"></head><body> <table border="0" cellspacing="5" cellpadding="5"><tr><td><b>New releases on freshmeat.net today:</b></td></tr> <?php// XML file$file = "http://www.freshmeat.net/backend/fm-releases.rdf"; // set up some variables for use by the parser$currentTag = "";$flag = "";$count = 0; // this is an associative array of channel data with keys ("title","link","description")$channel = array(); // this is an array of arrays, with each array element representing an<item> // each outer array element is itself an associative array // with keys ("title", "link", "description")$items = array(); // opening tag handlerfunction elementBegin($parser, $name, $attributes){ global $currentTag, $flag; $currentTag = $name; // set flag if entering <channel> or <item> block if ($name == "ITEM") { $flag = 1; } else if ($name == "CHANNEL") { $flag = 2; }} // closing tag handler function elementEnd($parser, $name){ global $currentTag, $flag, $count; $currentTag = ""; // set flag if exiting <channel> or <item> block if ($name == "ITEM") { $count++; $flag = 0; } else if ($name == "CHANNEL") { $flag = 0; }} // character data handlerfunction characterData($parser, $data){ global $currentTag, $flag, $items, $count, $channel; $data = trim(htmlspecialchars($data)); if ($currentTag == "TITLE" || $currentTag == "LINK" ||$currentTag =="DESCRIPTION") { // add data to $channels[] or $items[] array if ($flag == 1) { $items[$count][strtolower($currentTag)] .=$data; } else if ($flag == 2) { $channel[strtolower($currentTag)] .= $data; } } } // create parser$xp = xml_parser_create(); // set element handlerxml_set_element_handler($xp, "elementBegin", "elementEnd");xml_set_character_data_handler($xp, "characterData");xml_parser_set_option($xp, XML_OPTION_CASE_FOLDING, TRUE);xml_parser_set_option($xp, XML_OPTION_SKIP_WHITE, TRUE); // read XML fileif (!($fp = fopen($file, "r"))) { die("Could not read $file");} // parse datawhile ($xml = fread($fp, 4096)) { if (!xml_parse($xp, $xml, feof($fp))) { die("XML parser error: " .xml_error_string(xml_get_error_code($xp))); }} // destroy parserxml_parser_free($xp); // now iterate through $items[] array// and print each item as a table rowforeach ($items as $item){ echo "<tr><td><a href=" . $item["link"] . ">" . $item["title"] ."</a><br>" . $item["description"] . "</td></tr>"; } ?></table></body>
</html>
与先前的那段的主要区别在于,这段脚本创建了两个数组,用于保存分析过程中所提取的信息。其中,$channel是联合性数组(associative array),存放被处理的频道的基本描述信息,而$items是一个二维数组,包含关于单独的频道条目(channel intems)的信息。$items数组中的每一个元素本身又是一个联合性数组,包含title,URL和description关键字。$items数组中元素总数与RDF文档中的<item>区块总数相同。
还需注意$flag变量的变化,根据被处理的是<channel></channel>区块还是<item></item>区块,它现在保存两个值。这一点很有必要,因为只有这样,分析器才能把信息放入正确的数组里面。
一旦文档分析完毕,事情就简单了——遍历$items 数组,以表格形式打印其中的每一个条目(item)。远行结果如下:
博客介绍了将RDF内容插入Web站点时对脚本的改进。改进后的脚本创建两个数组保存分析信息,$channel存频道基本描述,$items存频道条目信息。还需注意$flag变量变化,分析完文档后遍历$items数组以表格形式打印条目。

被折叠的 条评论
为什么被折叠?



