想去掉除了段落标记之外的所有html标记,只要页面的文字,好比是我把代码贴到记事本里面的效果,去掉了链接等代码。
可以试试。
public static string DelHTML(string Htmlstring)//将HTML去除
{
#region
//删除脚本
Htmlstring =System.Text.RegularExpressions.
Regex.Replace(Htmlstring,@"","",System.Text.RegularExpressions.RegexOptions.IgnoreCase);
//删除HTML
Htmlstring =System.Text.RegularExpressions.
Regex.Replace(Htmlstring,@"]*)>","",System.Text.RegularExpressions.RegexOptions.IgnoreCase);
Htmlstring =System.Text.RegularExpressions.
Regex.Replace(Htmlstring,@"([\r\n])[\s]+","",System.Text.RegularExpressions.RegexOptions.IgnoreCase);
Htmlstring =System.Text.RegularExpressions.
Regex.Replace(Htmlstring,@"-->","",System.Text.RegularExpressions.RegexOptions.IgnoreCase);
Htmlstring =System.Text.RegularExpressions.
Regex.Replace(Htmlstring,@"