1 。配置
先下载C#的htmlparser包(Winistaparser)。及说明见我CSDN的资源空间。VS2005下项目->添加引用->浏览(找到)Winistaparser/bin/debug/winstahtmlparser.dll添加即可。
2。练习使用
快速入门教程见http://www.zhangyongjun.com/blog/article.asp?id=226;
代码实例如下如下:
using System;
using System.Collections.Generic;
using System.Text;
using Winista.Text.HtmlParser.Visitors;
using Winista.Text.HtmlParser;
using Winista.Text.HtmlParser.Util;//包含ParserException
using Winista.Text.HtmlParser.Filters;
using Winista.Text.HtmlParser.Tags;
namespace ConsoleApplication9
{
class Program
{
static void Main(string[] args)
{
string htmlcode = "<html><head><title>AAA</title><a href=/"http://www.ent.qq.com/">腾讯娱乐</a></head><body><a href=/"http://www.news.qq.com/">腾讯新闻</a><a href=/"http://www.edu.qq.com/">腾讯教育</a></body></html>";
Parser parser = Parser.CreateParser(htmlcode,"GBK");//用页面string 做一个parser;
HtmlPage page = new HtmlPage(parser);//用这个parser做一个visitor
try { parser.VisitAllNodesWith(page); }
catch (ParserException e1) { e1 = null; }
NodeList nodelist = page.Body;//body元素中的节点列表
NodeFilter nodefilter = new TagNameFilter("A");//建立过滤器
nodelist = nodelist.ExtractAllNodesThatMatch(nodefilter, true);//返回其中的A节点列表
for (int i = 0; i < nodelist.Size(); i++)
{
ATag link = (ATag)nodelist.ElementAt(i);
Console.Write(link.GetAttribute("href")+"/n");
}
Console.Read();
}
}
}
我的入门资料+C#htmlparser请到下载中心finallyliuyu的资源。