白猪掌柜的
为了也删除标记之间的空格,您可以使用以下方法,将正则表达式与输入HTML开头和结尾处的空格修剪之间的组合使用: public static string StripHtml(string inputHTML) { const string HTML_MARKUP_REGEX_PATTERN = @"]+>\s+(?=]+>"; inputHTML = WebUtility.HtmlDecode(inputHTML).Trim(); string noHTML = Regex.Replace(inputHTML, HTML_MARKUP_REGEX_PATTERN, string.Empty); return noHTML; }因此,对于以下输入:
test text
test 1
test 2
test 3
输出将仅是html标记之间没有空格或html之前或之后没有空格的文本:“ test text test 1 test 2 test 3”。请注意,前面的空格test text来自