使用正则表达式替换多组文字

如何使用正则表达式简洁处理一篇文章中出现的若干敏感词汇,将出现的敏感词汇使用下划线连接?

敏感词汇可能有多组,每组出现的次数也是随机的。

比如这样一篇文章

博客园有很多好的博文。

假设敏感词汇博客园、博客。

处理之后

博_客_园有很多好的博_文。

正则表达式为我们提供了便捷的方法。

Regex.Replace(input, rules,new MatchEvaluator(delegate(Match m){
   if (string.IsNullOrEmpty(m.Value) || 
    m.Value.ToCharArray().Length == 0) return string.Empty;
   return string.Join("_", m.Value.ToCharArray());
}));

第一个参数是检索的文章。

第二个参数是匹配规则,同时支持多种查找,中间使用|。如博客园|文章。

第三个是一个自定义方法,用于处理匹配到数据。

在上例中,rules:博客园|文章

delegate会执行两次。第一次匹配到的是博客园,第二次是文章。

 

转载于:https://www.cnblogs.com/lucika/p/4398508.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值