使用SgmlReader将HTML转换为合法的XML

 public static string Convert(string html)
{

    
if (string.IsNullOrEmpty(html.Trim()))
    {

        
return string.Empty;
    }

    
using (SgmlReader reader = new SgmlReader())
    {

        reader.DocType 
= "HTML";
        reader.InputStream 
= new StringReader(html);
        
using (StringWriter stringWriter = new StringWriter())
        {

            
using (XmlTextWriter writer = new XmlTextWriter(stringWriter))
            {

                reader.WhitespaceHandling 
= WhitespaceHandling.None;
                writer.Formatting 
= Formatting.Indented;
                XmlDocument doc 
= new XmlDocument();
                doc.Load(reader);
                
if (doc.DocumentElement == null)
                {

                    
return string.Empty;
                }

                
else
              
{
                    doc.DocumentElement.WriteContentTo(writer);
                }

                writer.Close();
                
string xhtml = stringWriter.ToString();
                
return xhtml;
            }

        }

    }

}

其他相关资料:http://www.kaiyuan8.org/Article/KLNvXMQhmKeyQyVGCfBZ.aspx

                     http://www.eggheadcafe.com/articles/20030317.asp

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值