c#使用HtmlParser解析HTML

1.相关依赖的包

Winista.Text.HtmlParser
从NutGet中获取就好

2.使用方法

将html文件导入

String html= "<!DOC......"//此为String版的html代码
//进行解析
Parser parser = Parser.CreateParser(html, "utf-8");
//筛选要查找的对象 这里查找td,封装成过滤器
NodeFilter filter = new TagNameFilter("td");
//将过滤器导入筛选,得到对象列表
NodeList nodes = parser.Parse(filter);
//遍历对象列表,进行取值
for (int i = 0; i < nodes.Size(); i++)
{
    INode textnode = nodes[i];        
    ITag tag = getTag(textnode.FirstChild);
    String id= tag.GetAttribute("value") ;
    String value= textnode.ToPlainTextString();

    result.Add(new pojo.Game(id,value));

}
private static ITag getTag(INode node)
{
    if (node == null)
        return null;
    return node is ITag ? node as ITag : null;
}

官方文档:
http://www.netomatix.com/Products/DocumentManagement/HTMLParserDocs.aspx

参考:
http://www.cnblogs.com/doll-net/archive/2007/06/29/800396.html
https://blog.csdn.net/cdefg198/article/details/8004203

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值