请访问dhtml.net 1.1版:
http://blog.csdn.net/sq_zhuyi/archive/2010/06/26/5695397.aspx
相信很多朋友都为解析HTML源码犯过愁,在社区里也经常看到有人提此类问题,
今天工作少,索性做了个解析HTML文档的通用组件,用法如下:
string url = "http://www.baidu.com/";//此处可以是一个URL,也可以是一段HTML字符串
Document doc = new Document(url);
Console.WriteLine(doc.Title);
Console.WriteLine(doc.GetElementById("u").InnerHTML);
输出结果:
百度一下,你就知道
<a href="http://passport.baidu.com/?login&tpl=mn">登录</a>
Document 成员如下:
属性
public ElementCollect Elements | 获取HTML文档中的所有节点 |
public Element Body | 获取body节点 |
public string Title | 获取文档title字符串 |
public FormCollect Forms | 获取文档中所有form节点 |
public FrameCollect Frames | 获取文档中所有frame节点 |
public ScriptCollect Scripts | 获取文档中所有script元素 |
public ImageCollect Images | 获取文档中所有img元素 |
方法
public ElementCollect GetElementsByTagName(string tag) | 通过tagName获取节点集合 |
public ElementCollect GetElementsByName(string name) | 通过节点name属性获取节点集合 |
public ElementCollect GetElementsByClass(string clas) | 通过节点class属性获取节点集合 |
public Element GetElementById(string id) | 通过节点id获取该节点 |
源码下载:
http://files.cnblogs.com/sqzhuyi/Dhtml.net-src(1.1).zip
作者:朱会震