XPath 的简单应用(源代码)

using  System;
using  System.Collections.Generic;
using  System.Text;
using  System.Xml;
using  System.Data;
using  System.Xml.XPath;
using  System.IO;
namespace  TestXPath
{
    
class XMLOpretion
    
{
        
///<summary>
        
/// recieve xml return DataTable, Static Method
        
///</summary>
        
/// <param name="url"> the path of xml document
        
/// </parm>

        public static DataTable FillDT(string url)
        
{
            StreamReader sr 
= new StreamReader(url);
            XmlDataDocument xd 
= new XmlDataDocument();
            xd.DataSet.ReadXml(sr);
            DataTable dt
=xd.DataSet.Tables[0];
            xd 
= null;
            sr.Close();
            
return dt;
        }

        
///<summary>
        
/// recieve xml,the XPath , return XPathNodeIterator, Static Method
        
///</summary>
        
/// <param name="url"> the path of xml document
        
/// </parm>
        
/// <param name="XPathSelect">the XPath select sentence</param>

        public static XPathNodeIterator XPathIter(string url, string XPathSelect)
        
{
            StreamReader sr 
= new StreamReader(url);
            XPathDocument doc 
= new XPathDocument(sr);
            XPathNavigator myNav 
= doc.CreateNavigator();
            XPathNodeIterator myIter 
= myNav.Select(XPathSelect);
            doc 
= null;
            sr.Close();
            
return myIter;
        }


    }

}
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
XPath是一种用于在XML文档中查找和定位节点的语言。它提供了一种简单而强大的方法来解析网页中的数据。 首先,我们需要了解页面的结构,以确定要提取的信息在哪个节点上。可以通过查看网页源代码或使用开发者工具来获取网页的结构信息。 一旦确定了要解析的节点,我们就可以使用XPath表达式来定位该节点。XPath表达式由一系列路径和条件组成。路径指定了要在节点树中搜索的路径,条件用于过滤节点。 例如,要提取网页中的所有标题,我们可以使用以下XPath表达式://h1。这将返回页面中所有的h1标签节点。 如果要进一步过滤节点,可以添加条件。例如,要提取所有class属性为"news-title"的h1标签,可以使用以下XPath表达式://h1[@class='news-title']。 一旦找到了相关的节点,我们就可以使用XPath表达式中的函数和运算符来提取节点的文本内容或其他属性。例如,要提取一个节点的文本内容,我们可以使用text()函数。要提取一个节点的属性值,我们可以使用@符号加上属性名。 xpath函数和运算符具有丰富的功能,可以根据具体需求进行灵活的解析和提取。在解析网页时,我们还可以使用相对路径、通配符和轴等特性来进一步定位和操作节点。 总结起来,XPath是一种强大的解析网页的工具,可以通过灵活的表达式定位和提取节点,帮助我们从网页中获取所需的数据。它在数据抓取、网页爬虫和网页自动化等应用中广泛使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值