在使用编辑器后获得的文字内容里会掺杂着一些html标记,有时会需要将它们处理掉,这里给出处理的方法,使用了正则表达式进行规则过滤,由于html标记都是基于<>这种格式,而且还有类似 这样的符号,所以分了2次处理将字符串处理为无html格式的字符串。
string StrNohtml = System.Text.RegularExpressions.Regex.Replace(html, "<[^>]+>", "");
StrNohtml=System.Text.RegularExpressions.Regex.Replace(StrNohtml, "&[^;]+;", "");
Console.WriteLine(StrNohtml);
转载:http://www.cnblogs.com/grokyao/archive/2008/12/04/1347512.html