游吟谷

谋事在人,成事在天

后台遍历一个HTML页面

前几天写一个程序,需要后台遍历一个动态生成的页面,找寻特定节点

于是写了以下代码:

 public class HtmlReader
 {
  public HtmlReader()
  {
  }
  ///
  /// 搜索特定标记的节点
  ///
  ///
  ///
  /// 返回属性值数组
  public static ArrayList SearchAttributes(string inMarkup, string KeyWord, string AttrName)
  {
   IHTMLDocument2 doc = new HTMLDocumentClass ();
   doc.write (new object [] {inMarkup});
   doc.close ();
   ArrayList searchList = new ArrayList();

   foreach(IHTMLElement el in (IHTMLElementCollection)doc.body.all)
   {
    if(el.tagName.ToLower() ==KeyWord)
    {
     string src=el.getAttribute(AttrName,0).ToString();
     //src=src.Remove(0,src.LastIndexOf("/")+1);
     searchList.Add(src);
    }
   }
   return searchList;
  }

 }

 

阅读更多
文章标签: html string object class
个人分类: 我的技术学习经历
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭