html解析库 htmlcxx 应用实例

因工作需要解析html,但本人又不想使用微软的 DomApi,所以到网上去找了一把开源库,发现几个比较好的

    比如 html tidy,和htmlcxx库等。可以用的很多,不再赘述,贴上写htmlcxx的应用例子:

   解析特定的文本段落

    std::string strHtml = "<font size=\"-1\" color=#808080>dddddd 加入了对话</font>";

    htmlcxx::HTML::ParserDom parser ;
    tree<htmlcxx::HTML::Node> dom = parser.parseTree(strHtml) ;

   

    tree<htmlcxx::HTML::Node>::iterator it = dom.begin();
    tree<htmlcxx::HTML::Node>::iterator end = dom.end();
    for ( ; it != end ; ++ it)
    {
        std::string strText;
        if (it->isComment())
            continue ;

        if (it->isTag())
        {
            it->parseAttributes();
           if(it->tagName() == "font")
           {
              std::pair<bool, std::string> Size = it->attribute("size");
              std::pair<bool, std::string> Color = it->attribute("color");
              
              std::string strSize = Size.second;
              std::string strColor = Color.second;
           }
        }
    }

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值