使用RegularExpressions去除HTML标签的字符串

网友要求做一个文章摘要,由于文章包含有Html标签,在截取文章头200个字符串时,得到的字符串将是一些意想不到的结果。因此让Insus.NET为他解决去除html标签,然后再从去除Html标签之后的结果截取200个字符串。

实现这个功能,可以使用RegularExpressions正则表达式:

.   匹配除 "\n" 之外的任何单个字符。

*  匹配前面的子表达式零次或多次。

?  匹配前面的子表达式零次或一次。

因此只要把文章的"<.*?>"替换为String.Empty即可。

 

接下来,Insus.NET写一个函数,在写函数之前,先引用一个命名空间:

using System.Text.RegularExpressions;

 

函数:

public  static  string RemoveHtmlTag( string articleString)
    {
         return Regex.Replace(articleString,  " <.*?> "string.Empty);

    }


截取多少个字符,可以使用Substring函数

Substring(0,num),num表示要截取字符的个数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值